Berlin 설문문항의 폐쇄성 수면무호흡증 선별 유용성 평가

Usefulness of the Berlin Questionnaire for Screening Patients With Obstructive Sleep Apnea

Article information

J Sleep Med. 2022;19(3):146-152
Publication date (electronic) : 2022 December 28
doi : https://doi.org/10.13078/jsm.220020
College of Nursing, Chonnam National University, Chonnam Research Institute of Nursing Science, Gwangju, Korea
양현주orcid_icon, 유성희orcid_icon
전남대학교 간호대학, 간호과학연구소
Address for correspondence Sung-Hee Yoo, RN, PhD College of Nursing, Chonnam National University, 42 Jebong-ro, Dong-gu, Gwangju 61469, Korea Tel: +82-62-530-4941 Fax: +82-62-227-4009 E-mail: shyoo@jnu.ac.kr
Received 2022 November 14; Revised 2022 November 25; Accepted 2022 November 28.

Trans Abstract

Objectives

This study aimed to evaluate the usefulness of the Berlin questionnaire (BQ) as a screening tool for obstructive sleep apnea (OSA) in a sleep clinic.

Methods

We used a retrospective review of 77 subjects with suspected OSA to conduct a secondary analysis of a previously published sleep study. A total of 77 subjects attended and completed overnight, in-laboratory polysomnography. Subjects completed the standard BQ in the evening just before the sleep study.

Results

The mean age of 77 subjects was 49.94±15.78 years, of which 37 (48.1%) were male and 42 (63.7%) were white. Forty-six subjects (59.7%) were diagnosed with OSA through polysomnography. In the analysis of each item of the standard BQ, the sensitivity ranged from 4.6% to 92.5%, and the specificity ranged from 13.3% to 85.7%. For item 8, the sensitivity, specificity, positive likelihood ratio, and negative likelihood ratio were 4.6%, 84.9%, 0.3, and 1.1, respectively. The area under the curve values of the standard BQ and after deleting item 8 were 0.634 and 0.751, respectively. When item 8 was deleted and each item on the standard BQ was calculated as one point, the cutoff values representing the highest Yuden index were 3.5 and 4.5.

Conclusions

A modified BQ that selects four different questions for each subject, regardless of the number of positive categories in the standard BQ, will provide improved accuracy in screening subjects with a high likelihood of having OSA.

서 론

폐쇄성 수면무호흡증(obstructive sleep apnea, OSA)은 수면 중 계속적인 호흡 노력에도 불구하고 상기도의 반복적인 폐쇄로 인하여 무호흡, 저호흡 및 각성이 발생하는 수면호흡장애(sleep disordered breathing)의 한 종류이다[1]. 무호흡저호흡 지수(apnea-hypopnea index, AHI)가 5 이상인 OSA의 유병률은 전 인구의 9%-38% 정도로 매우 흔한 질병이며, 나이가 들수록, 남자에서, 비만할수록 그 유병률이 높아진다[2]. 우리나라의 OSA 유병률은 남성의 경우 4.5%-27%, 여성의 경우 3.2%-16%로 세계적인 추세보다 다소 낮으나[3,4], 비만율 및 고령화가 가속화되는 실정을 고려하면 향후 유병률은 증가할 것으로 예측된다[5]. OSA는 주간 졸림, 피로, 직업수행 능력 감소 및 삶의 질 저하를 유발할 뿐만 아니라[1,3], 만약 치료하지 않는다면 치명적인 심혈관계 사건이 일어날 위험성이 2.04배, 뇌졸중 발생 위험성이 2.15배, 모든 원인으로 인한 사망위험이 1.54배 높아지는 것으로 알려져 있어서, OSA를 조기에 진단하고 적극적인 치료를 제공하는 것은 중요하다[6].

수면검사실 내 수면다원검사(polysomnography)는 OSA의 유무와 중증도를 확인하기 위한 표준 검사법으로 제시되고 있다[7]. 그러나 이 방법은 비싼 검사비용, 수면검사실에서 수면을 취해야 하는 불편함, 검사 시행에 많은 시간이 소요된다는 제한점이 있으며, 환자의 임상증상만으로 수면다원 검사를 처방하는데 대한 부담감으로 인해 대중화하여 적용하기에 어려움이 따른다[8]. 이로 인해 수면다원검사 전 예비 검사 또는 선별검사로서 객관적이며, 간단하고 신뢰도가 높고, 임상결정에 유용한 설문지에 대한 관심이 증가하였고, Berlin 설문(Berlin qeustionnaire), STOP 설문(STOP questionnaire), STOP-BANG 설문(STOP-BANG questionnaire)이 개발되어 널리 사용되고 있다[9]. 그중 Berlin 설문은 인구 집단의 수면무호흡을 선별하기 위해 일차 의료 기관에서 사용할 수 있도록 개발되었고[10], 현재 우리나라 수면클리닉에서 수면다원검사 전 OSA의 고위험을 예측하기 위해 흔히 사용되고 있다. Berlin 설문은 OSA를 유발하는 위험인자인 코골이, 주간 졸림, 비만, 고혈압 등의 항목을 질문하고 있으며, 설문도구 개발 시 지역사회 인구를 대상으로 민감도 86%, 특이도 77%의 정확도를 보고하였다[10].

하지만, Berlin 설문의 OSA 진단 유용성에 대한 결과는 연구마다 다르게 나타난다. 최신 메타분석 연구에서 Berlin 설문은 수면 클리닉 내원 환자, 수술 환자, 기타 환자군 모두에서 전반적으로 낮은 민감도와 특이도를 보여 OSA 선별 도구 중 가장 유용하지 않은 것으로 보고되었다[11]. 뿐만 아니라, OSA 선별도구의 진단 정확도를 분석한 다른 메타분석 연구에서도[9,12] Berlin 설문이 STOP 설문이나 STOP-BANG 설문보다 타당도, 정확도, 사용의 용이성이 낮은 것으로 보고되어 Berlin 설문의 진단 유용성에 대한 의문이 제기되었다. 하지만, OSA 진단 시 Berlin 설문의 타당도를 분석한 또 다른 연구에서는 수면 클리닉에 내원한 중등도 OSA 환자를 선별하는데 Berlin 설문의 민감도가 높음을 보고하고 있어[13], OSA를 선별하는데 있어 Berlin 설문도구의 유용성을 다각적으로 검토할 필요가 있다.

이에 본 연구에서는 수면클리닉을 방문한 환자를 대상으로 OSA를 선별하는데 있어 Berlin 설문도구의 유용성을 확인하고자 하였다.

방 법

연구설계 및 연구대상

본 연구는 OSA 환자의 사이토카인 일변화와 증상 표현형과의 관계를 파악하기 위해 시행된 연구에서[14] 연구 대상자를 선별하기 위한 목적으로 2016년 8월 5일부터 2017년 7월 6일까지 미국인을 대상으로 수집된 자료를 활용한 이차 자료 분석연구이다. 원자료는 자료 수집에 대한 사전 동의를 받고 서면 질문지를 통해 수집되었으며, Institutional Review Board (IRB) at the Hershey Medical Center (IRB No. 0002746)의 승인을 받은 후 연구자가 소속된 기관의 생명윤리위원회에 이차자료분석을 위한 심의면제 승인(1040198-221116-HR-138-01)하에 진행하였다. 본 연구에서는 원자료 중 일반적 특성, 수면관련 특성 및 Berlin 설문에 대한 자료를 이용하였으며, 연구 분석을 위해 총 77명의 표본이 포함되었다. 연구대상자는 폐쇄성 수면무호흡증이 의심되어 수면 클리닉 방문을 의뢰받은 만 18세 이상의 성인 남녀였으며, OSA의 확진을 위해 유형(level) I 표준 수면다원검사(full attended polysomnography)를 시행하였다.

측정 도구

수면다원검사

수면다원검사(24-analog channel and 10-DC channel Aurora TS amplifier system using Gamma software; Grass-Tele factor, West Warwick, Rhode Island)는 Hershey Medical Center 내 수면 클리닉에서 검사자의 관리 하에 하룻밤 동안 시행되었다. 표준검사항목으로 코와 입을 통한 공기의 출입, 가슴과 복부의 호흡운동, 뇌파, 안구운동, 턱과 경골전부의 근전도, 심전도, 혈중 산소포화도, 수면시의 자세 등이 포함되었다. 무호흡(apnea)은 10초 이상 동안 기류가 90% 이상 저하된 경우로 정의하였으며, 저호흡(hypopnea)은 10초 이상 동안 산소포화도가 4% 이상 감소하면서 기류가 30% 이상 저하되는 것으로 정의하였다. 무호흡-저호흡지수(AHI)는 시간당 무호흡지수(apnea index)와 저호흡지수(hypopnea index)의 합을 시간으로 나눈 값으로 정의하였으며, AHI 5 이상 15 미만인 경우를 경도(mild), AHI 15 이상 30 미만인 경우를 중등도(moderate), AHI 30 이상인 경우를 중증도(severe) 폐쇄성 수면무호흡으로 분류하였다.

Berlin 설문

Berlin 설문은 폐쇄성 수면무호흡을 선별하기 위한 자가보고형 설문지로 총 10개의 질문과 3가지 카테고리(category)로 구성되어 있다. 첫 번째 카테고리는 코골이 유무(Q1), 코골이의 정도(Q2) 및 빈도(Q3), 코골이가 다른 사람을 방해하는지 여부(Q4), 수면 중 목격된 호흡정지(Q5)와 관련된 5개 항목을 포함하고 있으며 총 점수가 2점 이상이면 양성으로 판정한다. 두 번째 카테고리는 수면 후 졸림이나 피로(Q6), 각성 시 졸림이나 피로(Q7), 졸음운전 여부의 빈도(Q8)와 관련된 3개 항목을 포함하고 있으며 총 점수가 2점 이상이면 양성으로 판정한다. 세 번째 카테고리는 혈압(Q9)과 체질량 지수(Q10) (body mass index, BMI)와 관련된 2개 항목을 포함하고 있으며 혈압이 높거나 BMI가 30 kg/m2 초과일 경우 양성으로 판정한다. 이러한 3개의 카테고리 중 2개 이상의 카테고리에서 양성을 보일 경우 OSA 고위험군으로 판정한다.

자료분석 방법

자료분석을 위해 Microsoft Excel 2019 (Microsoft Corporation, Redmond, WA, USA)와 SPSS 26.0 프로그램(IBM Corp., Armonk, NY, USA)을 사용하였다. Berlin 설문의 양성판정 기준과 Berlin 설문 내 각 항목의 OSA 판정에 대한 민감도(sensitivity), 특이도(specificity), 양성예측도(positive predictive value), 음성예측도(negative predictive value), 정확도(accuracy), 양성우도비(positive likelihood ratio), 음성 우도비(negative likelihood ratio) 및 유덴지수(Youden index)를 분석하였다. 더 나은 선별도구를 제안하기 위해 Berlin 설문 문항 중 양성우도비가 1보다 낮은, 즉 OSA가 있는 사람보다 없는 일반인에서 관련 증상이 더 많음을 나타냄으로써 선별 능력이 부족하다고 판단된 항목을 제거한 뒤 남은 문항으로 수정된 Berlin 설문도구를 구성하였고, 수정된 베를린 도구의 OSA 진단에 대한 예측도를 평가하기 위해 receiver operating characteristic (ROC) 곡선하 면적(area under the ROC curve, AUC)과 95% 신뢰구간(confidence interval)을 제시하였다. 마지막으로 기존 Berlin 설문의 양성 판정 기준과 각 문항을 1점 처리 한 10문항의 Berlin 설문 도구, 1보다 낮은 양성우도비를 보인 문항을 삭제한 수정된 Berlin 설문 도구의 OSA 예측도를 AUC로 비교하였고, 최적의 절단점을 제안하기 위해 유덴지수를 도출하였다.

결 과

대상자의 인구학적 특성 및 수면관련 특성

본 연구에 포함된 총 77명의 평균 연령은 49.94±15.78세였고, 남성이 37명(48.1%), 백인이 42명(63.7%)이었다. 이들의 평균 BMI는 36.84±10.82 kg/m2였고, 평균 수면 시간은 약 5시간 정도로 약 75%의 수면 효율을 나타냈다. AHI는 18.71±27.46으로 중등도 OSA를 나타내었고 평균 각성지수는 26.43±25.11이었다. 수면 중 산소포화도가 80%에서 90% 사이에 머무르는 시간은 33.81±70.59분이었고, 88% 이하로 측정되는 시간은 15.50±37.69분이었다. 수면 중 평균 산소포화도는 93.66%±3.12%였으며, 최저 산소포화도는 84.56%±7.16%였다. 표준 Berlin 설문으로 OSA 위험을 선별 검사한 결과 62명(80.5%)에서 양성을 보였고, 수면다원검사를 통해 실제 OSA로 진단된 대상자는 46명(59.7%)이었다(Table 1).

Demographic and sleep-related characteristics (n=77)

Berlin 설문 및 문항별 정확도

Berlin 설문의 OSA 진단 민감도는 91.3%, 특이도는 41.9%였고, 도구의 정밀도인 양성예측도는 70.0%, 정확도는 71.4%였다. Berlin 설문을 구성하는 각 문항의 OSA 진단 정확도를 분석한 결과, 각 문항의 민감도는 최저 4.6%에서 92.5% 범위로 나타났으며, 특이도는 최저 13.3%에서 85.7%까지의 범위를 나타내었다. 양성우도비가 1.0 미만인 문항(question, Q)은 Q8로 LR(+) 0.3이었고, 그 외 Q7의 LR(+)은 1.0, Q2, 3, 6의 LR(+)은 1.1이었다. 전체적으로 카테고리 2의 LR(+)은 1.1이었다. 민감도와 특이도를 반영한 정확분류도인 유덴지수가 가장 높은 것은 카테고리 1로 0.384였다(Table 2).

Diagnostic accuracy of the Berlin questionnaire in detecting OSA

수정된 Berlin 설문의 유용성

Berlin 설문에 의한 OSA 진단의 예측도를 확인하기 위해 ROC 곡선을 도출하였고, 이의 곡선하 면적(AUC) 값은 0.634였다. 기존 Berlin 설문에서 두 개의 카테고리 양성 여부에 따른 고위험 진단 외에 10문항을 각각 1점씩 계산한 도구로 변경하여 도출한 AUC 값은 0.739였고, 민감도가 가장 낮고 LR(+)에서 0.3을 보인 문항 Q8을 삭제한 후 9문항의 수정된 베를린 도구로 OSA 진단을 예측하는 ROC 곡선하 면적(AUC) 값은 0.751이었다(Fig. 1).

Figure 1.

Receiver operating characteristic (ROC) curve for the Berlin questionnaire. A: Standard Berlin. B: Modified Berlin including 10 items. C: Modified Berlin including 9 items. AUC, area under the ROC curve; CI, confidence interval.

각각의 문항을 1점으로 계산할 경우 가장 높은 유덴지수를 보인 절단값은 10문항과 9문항 베를린 도구 모두 절단값 3.5와 4.5에서 높아 카테고리에 상관없이 4문항이 양성인 경우 가장 높은 정확도를 보였다(Table 3).

Optimal cutoff value for the Berlin questionnaire

고 찰

본 연구는 OSA가 의심되어 확진을 위해 수면 클리닉에 의뢰된 성인 환자를 대상으로 Berlin 설문과 유형 I 표준 수면다원검사를 시행하여 OSA를 선별하는데 있어 Berlin 설문의 유용성을 평가하였다. 본 연구를 통해 현 Berlin 설문 문항 중 선별 능력이 저조한 항목은 제거한 후 카테고리에 상관없이 4문항이 양성인 경우를 절단값으로 적용하였을 때 OSA를 선별하는데 가장 높은 정확도를 나타내는 것을 확인하였다.

Berlin 설문은 개발 당시 민감도 86%, 특이도 77%, 양성 예측도 89%, 양성우도비 3.79로 진단적 유용성이 높게 나타났으나[10], 최신 메타분석 연구는 본 연구에서 산출된 41.9%의 특이도와 비슷한 수준인 30%에서 43%의 특이도를 보고하였다[11]. 또한, 경증, 중등도, 중증으로 OSA를 분류하였을 때 양성우도비는 각각 1.5, 1.2, 1.3으로 나타나[11] 본 연구에서처럼 진단적 유용성이 낮은 것으로 밝혀졌다. 양성우도비는 질병이 있는 사람이 양성 판정을 받을 확률(진양성)을 질병이 없는 사람이 양성으로 판정된 확률(위양성)로 나눈 값을, 음성우도비는 질병에 걸린 사람이 음성 판정을 받은 확률(위음성)을 질병이 없는 사람이 음성 판정을 받은 확률(진음성)로 나눈 값을 의미한다[15]. 진단 검사에서 양성우도비가 10 이상 또는 음성우도비가 0.1 이하인 경우 임상적 유용성이 높으며, 양성우도비와 음성우도비가 1에 가까울수록 진단적 도구로서 의미가 없음을 나타낸다[15]. 본 연구에서는 6개의 Berlin 설문 문항(Q2, 3, 4, 6, 7, 8)이 양성우도비와 음성우도비가 1에 가까워 OSA를 진단하는데 유용한 정보를 제공해주지 못하였고, 그중 특히 졸음운전의 경험을 묻는 질문은 우도비와 민감도에서 가장 낮은 수치를 나타냈다. 최근에 Berlin 설문 문항 중 OSA 고위험군을 민감하게 예측할 수 있는 항목을 판별한 후 4문항으로 구성된 Berlin 설문 축약본을 제시한 연구가 보고되었다[16]. De Nunzio 등[16]의 연구에 포함된 387명의 대상자 중 12%만이 졸음운전 경험이 있는 것으로 응답하였고, 졸음운전의 양성판정 기준이 되는 ‘매일’ 또는 ‘일주일에 3-4번’ 졸음운전 경험은 단 2%에서만 관찰되었다. 졸음운전의 양성판정 기준을 OSA 저위험군과 고위험군에 적용하였을 때 저위험군에서는 0%, 고위험군에서는 7%에서만이 ‘매일’ 또는 ‘일주일에 3-4번’ 졸음운전 경험이 있다고 응답하여 본 문항의 진단정확도는 매우 낮다는 것을 알 수 있다. 이와 비슷하게 인구집단을 기반으로 시행한 다른 연구에서도[17] 약 10%의 대상자만이 졸음운전의 경험이 있음을 보고하였고, 그 중 1.2%만이 ‘매일’ 또는 ‘일주일에 3-4번’으로 응답하여 졸음운전 문항이 OSA 위험군을 선별하는데 판별도 높은 항목인지에 대한 재고가 필요하다. 졸음운전에 대한 응답은 졸음운전과 관련된 사회적 소망반응 편중(social desirability response bias)의 우려와 비운전자인 경우 해당 항목에 응답할 수 없으므로, 비운전자의 응답누락으로 인한 체계적 오차 등과 같은 문제를 내포하고 있다. 만약 선별도가 낮은 졸음운전 문항을 삭제한다면, Berlin 설문의 카테고리 2에 포함된 총 3개 문항 중 2개 이상 문항에서 양성인 경우 카테고리 2를 양성으로 판정하는 원칙을 감안할 때, 카테고리 2의 양성판정은 더욱 엄격해지는 문제가 발생한다. 따라서 카테고리 별 양성 개수에 따라 OSA 고위험군을 선별하는 방법을 변경하여 각 문항을 개별점수화 하여 최적의 선별 정확도를 제시하는 절단값을 산출하는 방법 등을 고려해 볼 수 있다.

또한, Berlin 설문 내 카테고리 2의 주간 졸림과 피로 문항은 특이도가 30% 미만으로 나타나 OSA를 예측하는데 높은 위양성을 유발하였다. 비록 OSA 환자에서 주간 졸림과 피로가 흔히 나타나는 증상이기는 하지만[1,3], 이와 같은 증상은 불면증과 같은 다른 수면장애에서도 흔히 나타나는 비특이적인 증상이기 때문에[18] 수면클리닉을 내원한 환자 중 OSA 이외에 다른 진단받지 않은 수면장애가 있을 가능성이 높다. 뿐만 아니라 피로나 주간 졸림과 같은 증상은 질병 이외에도 연령, 성별, 생활습관, 직업 등에 영향을 받는 다면적인 속성을 가지고 있으므로 응답의 위양성 위험을 내포하고 있다. 주간 졸림과 연령과의 관련성을 파악하기 위해 약 1,400명의 성인 남녀를 7.5년 동안 추적 관찰한 연구에서 연령에 따른 주간 졸림은 U자형 곡선(U-shaped curve) 형태를 나타내며, 주간 졸림의 발병률은 노인 남성에게서 증가할 가능성이 더 높음을 보고하였다[19]. 또한, 45세 이상 성인의 피로 유병률은 약 20%이며, 피로는 임상적(불면증, 당뇨병, 우울증), 사회적(주관적 건강상태), 생물학적(빈혈, 갑상선 기능) 인자와 같은 다양한 요인에 의해 영향을 받으므로[20] OSA의 위험을 선별하는데 특이도가 떨어질 수 있다. 비록 Berlin 설문이 OSA 진단 이전의 선별검사임을 감안할 때 특이도 보다 민감도를 높이는 질문을 선택하는 것이 타당하지만, 특이도가 감소하면 추가·정밀 검사를 수행해야 하므로 시간적, 경제적 손실뿐만 아니라 선별 검사로서의 유용성이 떨어질 수 있다. Berlin 설문의 특이도를 높이기 위해 피로나 주간 졸림의 다차원적 속성을 반영하여 질문을 수정하거나 전체 문항의 가중치를 계산하여 각 항목별 가중치를 달리 적용하는 방법을 고려해 볼 수 있겠다.

대부분의 OSA 환자는 코골이를 가지고 있을 만큼 코골이는 OSA의 대표적인 증상이다[21]. 이를 반영하듯 Berlin 설문의 카테고리 1은 코골이와 수면 중 호흡정지와 관련된 5개 문항을 질문하고 있다. 본 연구에서 코골이 유무는 민감도, 예측도, 우도비 모두에서 OSA 고위험군을 선별하는데 적절한 문항으로 나타났지만, 코골이의 정도 및 빈도, 코골이가 타인을 방해하는지에 대한 질문은 정확도가 높지 않았다. 이는 코골이의 정도나 빈도는 자가 측정이 어려워 타인에 의해 관찰되거나 측정되어야 하므로 응답의 신뢰도가 감소하였거나, 함께 수면을 취하는 동거인이 없을 경우 해당 항목의 응답이 불가능하여 응답의 체계적 오차가 발생하였을 가능성이 있다. 이와 달리, 잠자는 동안 호흡을 멈추는 증상의 목격 정도는 OSA 고위험군을 선별하는데 가장 특이도가 높은 문항으로 나타났다. 이를 종합해 볼 때, 카테고리 1의 양성 판정의 기준을 코골이 여부와 수면 중 호흡정지에 점수 가중치를 부여하거나 코골이의 정도를 묻는 여과식 질문은 점수에 반영하지 않고 추가 정보를 획득하는 용도로만 사용하는 것을 고려할 필요가 있다.

본 연구결과를 토대로 민감도 및 예측도, 우도비가 가장 낮은 졸음운전 항목(Q8)을 삭제하고 9문항을 각 1점씩 계산한 수정된 베를린 도구를 도출하였다. 선별도구의 예측 정확도를 확인하기 위해 AUC 값을 구하였을 때, 표준 Berlin 설문의 AUC 값은 0.634였으나 수정된 베를린 도구는 0.751로 예측력이 향상되는 것을 확인하였다. ROC 곡선하 면적의 정확도 분류에서 0.50-0.70의 값은 낮은 정확도(poor accuracy)를, 0.70-0.80의 값은 허용할 만한 정확도(acceptable accuracy)로 해석하는 것을 감안하면[22], 본 연구에서 제시한 수정된 베를린 도구를 사용하였을 때 OSA의 선별 정확도는 더욱 향상될 것으로 판단된다. 또한, 수정된 베를린 도구를 카테고리에 상관없이 4문항이 양성인 경우를 절단값으로 하였을 때 유덴지수가 가장 높아 카테고리가 아닌 개별문항으로 선택된 점수체계를 고려할 수 있음을 확인하였다. 향후 OSA 고위험군을 선별할 때 OSA의 특징적 증상(예: 코골이, 수면 중 호흡정지)과 자가응답이 가능한 문항을 질문에 포함시키는 전략을 더 고려할 필요가 있다.

본 연구는 OSA를 선별하는데 Berlin 설문의 임상적 유용성을 향상시키는 방법을 제안하였지만 다음과 같은 제한점을 가지고 있다. 첫째, 본 연구는 한국인이 아닌 미국인(평균 BMI 36.84±10.82 kg/m2)을 대상으로 수행하여 연구결과를 한국의 OSA 고위험군에게 적용하는데 제한이 따를 수 있다. 선행연구에서 보고된 바와 같이, 동양인은 서양인보다 비만도가 낮지만 OSA 유병률은 두 인종 간 비슷하여[23] OSA를 유발하는 요인이 인종 간 다를 수 있음을 고려해야 한다. 둘째, 비록 연구에 포함된 대상자는 표준 수면다원검사를 통해 OSA를 진단 받았지만, 선별도구의 유용성 평가를 위해 포함된 대상자 수는 77명으로 작은 표본 크기였다.

본 연구를 토대로 다음과 같이 제언하고자 한다. 향후 국내 OSA 고위험군을 대상으로 대규모 코호트 연구를 시행하여 표준 Berlin 설문과 수정된 Berlin 설문의 도구 타당도를 검정하는 추가 연구가 필요하겠다. 또한, 주관적 판단을 기반으로 응답함으로써 발생하는 편향과 오차를 줄이기 위해 OSA를 민감하게 감별할 수 있는 객관적 지표(예: BMI, 목둘레 등)와 OSA의 특징적 증상(예: 코골이 유무, 수면 중 무호흡 유무 등)을 고려하고 환자 및 수면 파트너의 응답을 포함한 새로운 OSA 선별도구 개발을 제언한다.

Notes

The authors have no potential conflicts of interest to disclose.

Author Contributions

Conceptualization: Hyunju Yang, Sung-Hee Yoo. Data curation: Hyunju Yang. Investigation: Hyunju Yang. Methodology: Hyunju Yang, Sung-Hee Yoo. Supervision: Sung-Hee Yoo. Validation: Hyunju Yang, Sung-Hee Yoo. Visualization: Sung-Hee Yoo. Writing—original draft: Hyunju Yang. Writing—review & editing: Sung-Hee Yoo.

Funding Statement

None

References

1. Shin C. Epidemiology and definition of sleep disordered breathing. Tuberc Respir Dis 2009;66:1–5. https://doi.org/10.4046/trd.2009.66.1.1.
2. Senaratna CV, Perret JL, Lodge CJ, et al. Prevalence of obstructive sleep apnea in the general population: a systematic review. Sleep Med Rev 2017;34:70–81. https://doi.org/10.1016/j.smrv.2016.07.002.
3. Kim J, In K, Kim J, et al. Prevalence of sleep-disordered breathing in middle-aged Korean men and women. Am J Respir Crit Care Med 2004;170:1108–1113. https://doi.org/10.1164/rccm.200404-519OC.
4. Sunwoo JS, Hwangbo Y, Kim WJ, et al. Prevalence, sleep characteristics, and comorbidities in a population at high risk for obstructive sleep apnea: a nationwide questionnaire study in South Korea. PloS one 2018;13e0193549. https://doi.org/10.1371/journal.pone.0193549.
5. Ministry of Health and Welfare. 4th national health promotion comprehensive plan 2020 trend report [Internet] Sejong: Ministry of Health and Welfare; 2020. [cited 2022 Oct 15]; Available from: https://www.khealth.or.kr/board/view?menuId=MENU01320&linkId=1002768.
6. Ralls F, Cutchen L. A contemporary review of obstructive sleep apnea. Curr Opin Pulm Med 2019;25:578–593. https://doi.org/10.1097/MCP.0000000000000623.
7. Berry RB, Budhiraja R, Gottlieb DJ, et al. Rules for scoring respiratory events in sleep: update of the 2007 AASM manual for the scoring of sleep and associated events. Deliberations of the sleep apnea definitions task force of the American Academy of Sleep Medicine. J Clin Sleep Med 2012;8:597–619. https://doi.org/10.5664/jcsm.2172.
8. Kang SG, Shin SH, Lee YJ, et al. Clinical and physical characteristics that affect apnea-hypopnea index in suspected obstructive sleep apnea patients: the preliminary study. Korean J Biol Psychiatry 2013;20:55–61. https://doi.org/10.5664/jcsm.2172.
9. Abrishami A, Khajehdehi A, Chung F. A systematic review of screening questionnaires for obstructive sleep apnea. Can J Anaesth 2010;57:423–438. https://doi.org/10.1007/s12630-010-9280-x.
10. Netzer NC, Stoohs RA, Netzer CM, Clark K, Strohl KP. Using the Berlin questionnaire to identify patients at risk for the sleep apnea syndrome. Ann Intern Med 1999;131:485–491. https://doi.org/10.7326/0003-4819-131-7-199910050-00002.
11. Bernhardt L, Brady EM, Freeman SC, et al. Diagnostic accuracy of screening questionnaires for obstructive sleep apnoea in adults in different clinical cohorts: a systematic review and meta-analysis. Sleep Breath 2022;26:1053–1078. https://doi.org/10.1007/s11325-021-02450-9.
12. Chiu HY, Chen PY, Chuang LP, et al. Diagnostic accuracy of the Berlin questionnaire, STOP-BANG, STOP, and Epworth sleepiness scale in detecting obstructive sleep apnea: a bivariate meta-analysis. Sleep Med Rev 2017;36:57–70. https://doi.org/10.1016/j.smrv.2016.10.004.
13. Senaratna CV, Perret JL, Matheson MC, et al. Validity of the Berlin questionnaire in detecting obstructive sleep apnea: a systematic review and meta-analysis. Sleep Med Rev 2017;36:116–124. https://doi.org/10.1016/j.smrv.2017.04.001.
14. Yang H, Engeland CG, King TS, Sawyer AM. The relationship between diurnal variation of cytokines and symptom expression in mild obstructive sleep apnea. J Clin Sleep Med 2020;16:715–723. https://doi.org/10.5664/jcsm.8332.
15. Akobeng AK. Understanding diagnostic tests 2: likelihood ratios, preand post-test probabilities and their use in clinical practice. Acta Paediatr 2007;96:487–491. https://doi.org/10.1111/j.1651-2227.2006.00179.x.
16. De Nunzio G, Conte L, Lupo R, et al. A new Berlin questionnaire simplified by machine learning techniques in a population of Italian healthcare workers to highlight the suspicion of obstructive sleep apnea. Front Med (Lausanne) 2022;9:866822. https://doi.org/10.3389/fmed.2022.866822.
17. Tan A, Yin JD, Tan LW, van Dam RM, Cheung YY, Lee CH. Using the Berlin questionnaire to predict obstructive sleep apnea in the general population. J Clin Sleep Med 2017;13:427–432. https://doi.org/10.5664/jcsm.6496.
18. Benz F, Knoop T, Ballesio A, et al. The efficacy of cognitive and behavior therapies for insomnia on daytime symptoms: a systematic review and network meta-analysis. Clin Psychol Rev 2020;80:101873.
19. Fernandez-Mendoza J, Vgontzas AN, Kritikou I, Calhoun SL, Liao D, Bixler EO. Natural history of excessive daytime sleepiness: role of obesity, weight loss, depression, and sleep propensity. Sleep 2015;38:351–360. https://doi.org/10.5665/sleep.4488.
20. Galland-Decker C, Marques-Vidal P, Vollenweider P. Prevalence and factors associated with fatigue in the Lausanne middle-aged population: a population-based, cross-sectional survey. BMJ Open 2019;9e027070. https://doi.org/10.1136/bmjopen-2018-027070.
21. Chang JL, Kezirian EJ. What are the health risks of untreated snoring without obstructive sleep apnea? Laryngoscope 2013;123:1321–1322. https://doi.org/10.1002/lary.23670.
22. Hosmer DW Jr, Lemeshow S, Sturdivant RX. Assessing the fit of the model. In : Hosmer DW Jr, Lemeshow S, Sturdivant RX, eds. Applied logistic regression 3rd edth ed. Hoboken, NJ: John Wiley & Sons; 2013. p. 153–225.
23. Ip MS, Lam B, Lauder IJ, et al. A community study of sleep-disordered breathing in middle-aged Chinese men in Hong Kong. Chest 2001;119:62–69. https://doi.org/10.1378/chest.119.1.62.

Article information Continued

Figure 1.

Receiver operating characteristic (ROC) curve for the Berlin questionnaire. A: Standard Berlin. B: Modified Berlin including 10 items. C: Modified Berlin including 9 items. AUC, area under the ROC curve; CI, confidence interval.

Table 1.

Demographic and sleep-related characteristics (n=77)

Variables Value
Age, yr 49.94±15.78
Sex
 Male 37 (48.1)
 Female 40 (51.9)
Race (n=66)
 White 42 (63.7)
 African American 15 (22.7)
 Asian 8 (12.1)
 Other 1 (1.5)
BMI, kg/m2 36.84±10.82
Total sleep time, min 308.14±125.87
 W 83.66±65.47
 N1 26.51±14.79
 N2 199.21±87.58
 SWS 33.69±35.42
 REM 44.92±39.03
Sleep efficiency, % 75.35±15.69
AHI, events/hr 18.71±27.46
ArI, events/hr 26.43±25.11
ST80, min 33.81±70.59
ST88, min 15.50±37.69
Mean SaO2, % 93.66±3.12
Lowest SaO2, % 84.56±7.16
Berlin questionnaire
 Negative 15 (19.5)
 Positive 62 (80.5)
  Category 1 56 (72.7)
  Category 2 55 (71.4)
  Category 3 53 (68.8)
OSA
 No 31 (40.3)
 Yes 46 (59.7)

Data are presented as mean±standard deviation or n (%). BMI, body mass index; W, stage wake sleep; N1, non-rapid eye movement (NREM) sleep; N2, NREM 2 sleep; SWS, slow wave sleep or NREM 3 sleep; REM, rapid eye movement; AHI, apnea-hypopnea index; ArI, arousal index; ST80, total sleep time spent with O2 saturations between 80% and 90%; ST88, total sleep time spent with O2 saturations less than or equal to 88%; OSA, obstructive sleep apnea

Table 2.

Diagnostic accuracy of the Berlin questionnaire in detecting OSA

Berlin Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 CAT1 CAT2 CAT3
Sensitivity (%) (95% CI) 91.3 (83.2–99.5) 89.1 (80.1–98.1) 61.5 (46.3–76.8) 92.5 (84.3–100) 86.7 (76.7–96.6) 39.5 (23.9–55.0) 80.4 (69.0–91.9) 76.1 (63.7–88.4) 4.6 (0.0–10.7) 45.7 (31.3–60.1) 73.9 (61.2–86.6) 90 (77.2–96.7) 73.9 (61.2–86.6) 82.6 (71.7–93.6)
Specificity (%) (95% CI) 41.9 (24.6–59.3) 48.4 (30.8–66.0) 40 (15.2–64.8) 13.3 (0.0–30.5) 27.3 (8.7–45.9) 85.7 (70.8–100) 29 (13.1–45.0) 22.6 (7.9–37.3) 84.9 (72.6–97.1) 67.7 (51.3–84.2) 67.7 (51.3–84.2) 48.4 (30.8–66.0) 32.3 (15.8–48.7) 51.6 (34.0–69.2)
PPV (%) (95% CI) 70 (58.4–81.6) 71.9 (60.3–83.6) 72.7 (57.5–87.9) 74 (61.8–86.2) 70.9 (58.9–82.9) 83.3 (66.1–100) 62.7 (50.4–75.1) 59.3 (46.8–71.9) 28.6 (0.0–62.0) 67.7 (51.3–84.2) 77.3 (64.9–89.7) 71.4 (59.6–83.3) 61.8 (49.0–74.7) 71.7 (59.6–83.8)
NPV (%) (95% CI) 76.5 (56.3–96.6) 75 (56.0–94.0) 28.6 (9.3–47.9) 40 (0.0–82.9) 50 (21.7–78.3) 43.9 (28.7–59.1) 50 (26.9–73.1) 38.9 (16.4–61.4) 40 (28.5–51.5) 45.7 (31.3–60.1) 63.6 (47.2–80.1) 71.4 (52.1–90.8) 45.5 (24.7–66.3) 66.7 (47.8–85.5)
Accuracy (95% CI) 71.4 (61.3–81.5) 72.7 (62.8–82.7) 55.6 (42.3–68.8) 70.9 (58.9–82.9) 67.2 (55.9–78.4) 55.9 (43.3–68.6) 59.7 (48.8–70.7) 54.6 (43.4–65.7) 38.9 (28.1–49.9) 54.6 (43.4–65.7) 71.4 (61.3–81.5) 71.4 (61.3–81.5) 57.1 (46.1–68.2) 70.1 (59.9–80.4)
LR(+) (95% CI) 1.6 (1.2–2.2) 1.7 (1.2–2.5) 1.1 (0.6–1.7) 1.1 (0.9–1.3) 1.2 (0.9–1.6) 2.8 (0.9–8.5) 1.1 (0.9–1.5) 1 (0.8–1.3) 0.3 (0.1–1.5) 1.4 (0.8–2.6) 2.3 (1.3–3.9) 1.7 (1.2–2.4) 1.1 (0.8–1.5) 1.7 (1.2–2.5)
LR(-) (95% CI) 0.2 (0.1–0.6) 0.2 (0.1–0.6) 1 (0.5–2.0) 0.6 (0.1–3.0) 0.5 (0.2–1.3) 0.7 (0.5–0.9) 0.7 (0.3–1.5) 1.1 (0.5–2.4) 1.1 (0.9–1.3) 0.8 (0.6–1.2) 0.4 (0.2–0.7) 0.3 (0.1–0.6) 0.8 (0.4–1.6) 0.3 (0.2–0.7)
Youden index 0.332 0.375 0.015 0.058 0.140 0.252 0.094 -0.013 -0.105 0.134 0.416 0.384 0.062 0.342

OSA, obstructive sleep apnea; Berlin, two or more positive categories; CAT1, category 1 of the Berlin questionnaire; CAT2, category 2 of the Berlin questionnaire; CAT3, category 3 of the Berlin questionnaire; CI, confidence interval; PPV, positive predictive value; NPV, negative predictive value; LR+, positive likelihood ratio; LR-, negative likelihood ratio; Youden index, Max (Sensitivity – [1 – Specificity])

Table 3.

Optimal cutoff value for the Berlin questionnaire

Cutoff value Berlin including 10 items
Berlin including 9 items
Sensitivity at cutoff value (%) Specificity at cutoff value (%) Youden index Sensitivity at cutoff value (%) Specificity at cutoff value (%) Youden index
2.5 95.7 35.5 0.312 95.7 35.5 0.312
3.5 91.3 48.4 0.397 91.3 51.6 0.429
4.5 78.3 61.3 0.396 78.3 61.3 0.396
5.5 67.4 64.5 0.319 67.4 64.5 0.319