۱۶ مطالعه را با مجموع ۱۱۴۶ شرکتکننده در متاآنالیز وارد کردیم. فقط یک مطالعه شامل ۵۲ شرکتکننده خطر پائین سوگیری (bias) و نگرانی کم را در مورد قابلیت کاربرد در حوزه انتخاب بیمار داشت. میانه احتمال پیش‐ آزمون بیماری غیر‐قابل برداشت پس از CT اسکن در تمام مطالعات ۴۱,۴% بود (یعنی ۴۱ بیمار از ۱۰۰ شرکتکننده که در CT اسکن مبتلا به سرطان قابل برداشت تشخیص داده شده بودند، در لاپاروتومی غیر‐قابل برداشت تشخیص داده شدند). خلاصه حساسیت لاپاروسکوپی تشخیصی ۶۴.۴% (۹۵% فاصله اطمینان (CI): %۵۰.۱ تا ۷۶.۶%) گزارش شد. با فرض اینکه احتمال پیش‐ آزمون معادل ۴۱.۴% است، احتمال پس‐ آزمون بیماری غیر‐قابل برداشت برای شرکتکنندگان با یک نتیجه تست منفی معادل ۰.۲۰ بود (۹۵% CI؛ ۰.۱۵ تا ۰.۲۷). این نشان میدهد اگر پس از انجام لاپاروسکوپی تشخیصی و CT اسکن به فردی گفته شود که بیماری قابل برداشت دارد، ۲۰% احتمال دارد که سرطان غیر‐قابل برداشت داشته باشد، در مقایسه با ۴۱% احتمال این موضوع، اگر فقط CT را به تنهایی دریافت کند.
تجزیهوتحلیل زیرگروه از افراد مبتلا به سرطان پانکراس خلاصه حساسیت ۶۷,۹%؛ (۹۵% CI؛ ۴۱.۱% تا ۸۶.۵%) را ارائه داد. احتمال پس‐ آزمون از بیماری غیر‐قابل برداشت پس از آنکه در CT و لاپاروسکوپی تشخیصی قابل برداشت تشخیص داده شدند، ۱۸% بود، در مقایسه با ۴۰.۰% افرادی که فقط CT اسکن دریافت کردند.
پیشینه
پانکراس یک عضو واقع در شکم نزدیک به اتصال معده و روده کوچک است. این عضو شیره گوارشی را ترشح میکند که برای هضم تمام مواد غذایی ضروری است. شیره گوارشی ترشح شده در پانکراس به قسمت بالای روده کوچک از طریق کانال پانکراس تخلیه میشود. مجرای صفراوی لولهای است که صفرا را از کبد و کیسه صفرا تخلیه میکند. کانالهای پانکراس و صفرا پیش از اینکه به روده کوچک تخلیه شوند، یک مسیر مشترک دارند. این ناحیه به نام ناحیه پریآمپولاری (periampullary) نامیده میشود. برداشت توده با جراحی تنها درمان بالقوه درمانی برای سرطانهای ناشی از مناطق پانکراس و پریآمپولاری است. بخش قابل توجهی از بیماران در معرض عملیات اکتشافی بزرگ شکم باز (لاپاروتومی) غیر‐ضروری هستند زیرا CT اسکن آنها میزان گسترش سرطان را دست کم گرفته است. اگر در طول عملیات اصلی باز به نظر میرسد که سرطان در داخل شکم گسترش یافته، بیماران برای درمانهای جایگزین مانند شیمیدرمانی ارجاع داده میشوند که سرطان را درمان نمیکنند؛ اما ممکن است بقای بیمار را افزایش دهند.
اگر گسترش سرطان درون شکم شناخته شده باشد، ممکن است از انجام این جراحی باز شکمی اجتناب شود. حداقل تست مورد استفاده برای مرحلهبندی معمولا اسکن کامپیوتری (computed tomography; CT) است. با این حال، سیتی اسکن می تواند مرحله سرطان را کم حساب کند، یعنی میتواند گسترش سرطان را کماهمیت جلوه دهد. لاپاروسکوپی (laparoscopy)، پروسیجری است که در آن از طریق یک برش کوچک (سوراخ کلید) جراحی یک تلسکوپ کوچک در داخل شکم قرار داده میشود، میتواند گسترش ناشناخته در CT اسکن را تشخیص دهد. مطالعات مختلف، دقت متفاوت لاپاروسکوپی را در ارزیابی اینکه سرطان میتواند برداشته شود یا خیر، گزارش میدهد. هدف ما این بود که بدانیم میانگین دقت تشخیص لاپاروسکوپی برای مرحلهبندی سرطانهای پانکراس و پریآمپولاری که بعد از CT اسکن قابل برداشت گزارش شدهاند، چیست. این مرور یک نسخه بهروز از مرور قبلی ما است.
واژهنامه اصطلاحات در ضمیمه ۱ ارائه شده است.
ویژگیهای مطالعه
یک جستوجوی کامل در منابع علمی برای شناسایی مطالعات منتشر شده تا ۱۵ می ۲۰۱۶ انجام دادیم. ۱۶ مطالعه را با حضور ۱۱۴۶ نفر از افراد مبتلا به سرطان پانکراس یا پریآمپولاری شناسایی کردیم که بر اساس نتایج مرحلهبندی CT اسکن، واجد شرایط جراحی بالقوه درمانی بودند. این مطالعات لاپاروسکوپی تشخیصی را ارزیابی کرده و نتایج حاصل از این پروسیجر را با تشخیص نهایی جراح که در طول جراحی ماژور شکم یا تستهای زیر میکروسکوپ اعلام کرده سرطان قابل برداشت نیست، مقایسه کردهاند.
کیفیت شواهد
تمام مطالعات در یک یا چند زمینه کیفیت نامشخص یا پائین روششناسی داشتند که ممکن است اعتبار یافتههای ما را تضعیف کند.
نتایج کلیدی
از میان افرادی که CT نشان میدهد سرطان با جراحی بالقوه قابل درمان است، درصد آنهایی که سرطان گستردهتر در مرحلهبندی بیشتر با لاپاروسکوپی تشخیصی یا لاپاروتومی تشخیص داده شد، بین مطالعات بین ۱۷% و ۸۲% بود. میانه درصد افرادی که گسترش سرطان آنها در سیتی اسکن تشخیص داده نشده، ۴۱% بود. اضافه کردن مرحله لاپاروسکوپی به سیتی اسکن ممکن است تعداد افرادی را که دارای بیماری غیر‐قابل برداشت با جراحی هستند و تحت جراحی ماژور غیر‐ضروری قرار میگیرند، به ۲۰% کاهش دهد، در مقایسه با افرادی که تحت عمل غیر‐ضروری بعد از CT اسکن قرار دارند (۴۱%). این بدان معنی است که با استفاده از لاپاروسکوپی تشخیصی میتوان نرخ جراحیهای باز ماژور غیر‐ضروری را در افرادی که تحت جراحی بزرگ برای سرطان پانکراس بالقوه قابل درمان با روش جراحی قرار میگیرند، به نصف کاهش داد.
شصتوپنج مطالعه شامل ۸۶,۱۳۹ زن باردار وارد شدند (۳۱۴۱ آنیوپلوئید و ۸۲,۹۹۸ یوپلوئید). در چهار حوزه ابزار QUADAS‐۲ هیچ مطالعهای در معرض خطر پائین سوگیری (bias) قضاوت نشد اما در مورد قابلیت کاربرد آن نگرانیهای کمی وجود داشت. از ۶۵ مطالعه، ۴۲ مطالعه زنان بارداری را که در معرض خطر بالا قرار داشتند به کار گرفتند، پنج مطالعه جمعیت انتخاب نشده و ۱۸ مطالعه گروههایی را که در معرض خطر ترکیبی آنیوپلوئیدی جنینی قرار داشتند به کار گرفتند. میان ۶۵ مطالعه، ۴۴ مطالعه MPSS و ۲۱ مطالعه TMPS را ارزیابی کردند، از بین این مطالعات، پنج مطالعه نیز gNIPT را با تست غربالگری مرسوم (بیوشیمیایی، اولتراسوند یا هر دو) مقایسه کرد. چهلوشش مطالعه از این ۶۵ مطالعه (۷۱%) نرخ شکست آزمون gNIPT را گزارش کردند، که برای MPSS بین ۰% و ۲۵% و برای TMPS بین ۰,۸% و ۷.۵% بود.
در جمعیت زنان باردار انتخاب نشده، فقط یک مطالعه MPSS را مورد بررسی قرار داد؛ این مطالعه T۲۱؛ T۱۸ و T۱۳ را ارزیابی کرد. TMPS برای T۲۱ در چهار مطالعه شامل گروههای انتخاب نشده ارزیابی شد؛ سه مطالعه از این مطالعات نیز T۱۸ و ۱۳ را ارزیابی کردند. در تجزیهوتحلیلهای تجمعی (۸۸ مورد T۲۱؛ ۲۲ مورد T۱۸؛ هشت مورد T۱۳ و ۲۰,۶۴۹ مورد بارداری سالم (بدون T۲۱؛ T۱۸ و T۱۳))، حساسیت بالینی (۹۵% فاصله اطمینان (CI)) با TMPS به ترتیب ۹۹,۲% (۷۸.۲% تا ۱۰۰%)؛ ۹۰.۹% (۷۰.۰% تا ۹۷.۷%) و ۶۵.۱% (۹.۱۶% تا ۹۷.۲%) برای T۲۱؛ T۱۸ و T۱۳ بود. ویژگی بالینی مربوطه برای T۲۱؛ T۱۸ و T۱۳ بالاتر از ۹۹.۹% گزارش شد.
در جمعیت پُر‐خطر، MPSS برای T۲۱؛ T۱۸ و T۱۳ و ۴۵،X به ترتیب در ۳۰، ۲۸، ۲۰ و ۱۲ مطالعه ارزیابی شد. در تجزیهوتحلیلهای تجمعی (۱۰۴۸ مورد T۲۱؛ ۳۳۲ مورد T۱۸؛ ۱۲۸ مورد T۱۳ و ۱۵,۷۹۷ مورد بارداری سالم)، حساسیت بالینی (۹۵% فاصله اطمینان (CI)) با MPSS به ترتیب ۹۹,۷% (۹۸.۰% تا ۱۰۰%)، ۹۷.۸% (۹۲.۵% تا ۹۹.۴%)، ۹۵.۸% (۸۶.۱% تا ۹۸.۹%) و ۹۱.۷% (۷۸.۳% تا ۹۷.۱%) برای T۲۱؛ T۱۸ و T۱۳ و ۴۵،X بود. ویژگیهای بالینی مربوطه (۹۵% CI)؛ ۹۹.۹% (۹۹.۸% تا ۱۰۰%)؛ ۹۹.۹% (۹۹.۸% تا ۱۰۰%)؛ ۹۹.۸% (۹۹.۸% تا ۹۹.۹%) و ۹۹.۶% (۹۸.۹% تا ۹۹.۸%) بود. در این گروه خطر، TMPS برای T۲۱؛ T۱۸ و T۱۳ و ۴۵،X در شش، پنج، دو و چهار مطالعه مورد ارزیابی قرار گرفت. در تجزیهوتحلیلهای تجمعی (۲۴۶ مورد T۲۱؛ ۱۱۲ مورد T۱۸؛ ۲۰ مورد T۱۳ و ۴۲۸۲ بارداری سالم)، حساسیت بالینی (۹۵% CI) با TMPS به ترتیب ۹۹.۲% (۹۶.۸% تا ۹۹.۸%)؛ ۹۸.۲% (۹۳.۱% تا ۹۹.۶%) و ۱۰۰% (۸۳.۹% تا ۱۰۰%) و ۹۲.۴% (۸۴.۱% تا ۹۶.۵%) برای T۲۱؛ T۱۸ و T۱۳ و ۴۵،X بود. ویژگیهای بالینی برای T۲۱؛ T۱۸ و T۱۳ بالاتر از ۱۰۰% و برای ۴۵،X معادل ۹۹.۸% (۹۸.۳% تا ۱۰۰%) بود. مقایسه غیر‐مستقیم MPSS و TMPS برای T۲۱؛ T۱۸ و ۴۵،X هیچ تفاوت آماری را در حساسیت بالینی، ویژگیهای بالینی یا هر دو نشان نداد. با توجه به دادههای محدود، تجزیهوتحلیل مقایسهای MPSS و TMPS برای T۱۳ امکانپذیر نبود.
ما قادر به انجام تجزیهوتحلیلهای gNIPT برای ۴۷،XXX؛ ۴۷،XXY و ۴۷،XYY نبودیم زیرا مطالعات کمی در یک یا چند گروه خطر، وجود داشت یا مطالعهای وجود نداشت.
این نتایج نشان میدهد که MPSS و TMPS از لحاظ حساسیت و ویژگی بالینی برای تشخیص T۳۱؛ T۱۸؛ T۱۳ جنینی و آنیوپلوئیدی کروموزوم جنسی (sex chromosome aneuploidy; SCA) مشابه هستند. با این حال، هیچ مطالعهای دو رویکرد سربهسر (head‐to‐head) را در کوهورت یکسانی از بیماران مقایسه نکرد. دقت gNIPT به عنوان تست غربالگری پریناتال به عنوان یک تست غربالگری درجه دوم، برای شناسایی بارداریهای در معرض خطر بسیار پائین آنیوپلوئیدی جنینی (T۲۱؛ T۱۸ و T۱۳) به طور عمده مورد بررسی قرار گرفته بنابراین از پروسیجرهای تهاجمی اجتناب میشود. روشهای تست غیر‐تهاجمی پریناتال مبتنی بر ژنومیک به نظر میرسد برای تشخیص تریزومیهای جنینی ۲۱؛ ۱۸ و ۱۳ در جمعیتهای پُر‐خطر حساس و بسیار خاص است. در مورد دقت gNIPT به عنوان یک تست غربالگری درجه یک آنیوپلوئیدی در جمعیت زنان باردار انتخاب نشده دادههای کمی وجود دارد. با توجه به جایگزینی تستهای تهاجمی، عملکرد gNIPT مشاهده شده در این مرور برای جایگزینی با تستهای تشخیصی تهاجمی فعلی کافی نیست.
ما نتیجه گرفتیم که با توجه به دادههای فعلی درباره عملکرد gNIPT، کاریوتایپهای تهاجمی جنینی برای تایید وجود ناهنجاری کروموزومی قبلی برای تصمیمگیری غیر‐قابل برگشت مربوط به پیامد بارداری هنوز به یک رویکرد تشخیصی نیاز دارند. با این حال، بسیاری از مطالعات مربوط به gNIPT، به ویژه از نظر انتخاب شرکتکنندگان، مستعد سوگیری بودند.
موضوع چیست؟
تست جدید (تست غیر‐تهاجمی پریناتال مبتنی بر ژنومیک (genomics‐based non‐invasive prenatal testing; gNIPT)) برای تشخیص تعداد غیر‐طبیعی کروموزوم در ماده ژنتیکی نوزاد متولد نشده (DNA) که در خون مادر یافت میشود، چقدر دقیق است؟ ما دقت غربالگری سندروم داون (Down syndrome) (تریزومی ۲۱)، سندروم ادوارد (Edward syndrome) (تریزومی ۱۸)، سندروم پاتو (Patau syndrome) (تریزومی ۱۳)، سندروم ترنر (Turner syndrome) (۴۵،X)، سندروم کلاینفلتر (Klinefelter syndrome) (۴۷،XXY)، سندروم X سهگانه (۴۷،XXX) و سندروم ۴۷،XYY را ارزیابی کردیم. روشهای مختلفی برای استفاده از gNIPT وجود دارد. ما MPSS (توالییابی شاتگان موازی وسیع) را که تمام DNA را تست کرد و TMPS (توالییابی موازی هدفمند در حد وسیع) را که DNA را مورد هدف قرار داد، ارزیابی کردیم.
پیشینه
در انسانها ۴۶ کروموزوم (۲۳ جفت) وجود دارد. تعداد غیر‐طبیعی کروموزومها ممکن است منجر به اختلالات ژنتیکی شود که هیچ درمانی ندارند. داشتن یک کروموزوم اضافی، تریزومی و داشتن یک کروموزوم جنسی بیشتر (یا کمتر) ناهنجاری کروموزوم جنسی (sex chromosome abnormality; SCA) نامیده میشود. شایعترین تریزومی سندروم داون است که تقریبا در یک نوزاد از هر ۱۰۰۰ نوزاد رخ میدهد. کودکان مبتلا به داون رشد آهسته، ویژگیهای بارز صورت و معلولیت ذهنی خفیف تا متوسطی دارند، بعضی از آنها بعدا در زندگی نیاز به آموزش تخصصی دارند. با این حال، نشانههای آن از خفیف تا شدید متفاوت هستند، به طوری که در برخی از نوزادان منجر به زندگی نسبتا نرمال میشود. نوزادان دارای سایر شرایط تریزومی یا SCA درجات مختلفی از ناتوانی را دارند اما احتمال ابتلای کودک به آن کمتر است.
تستهای غربالگری فعلی در مورد تایید اینکه کودک به این بیماری مبتلاست یا خیر، مورد نیاز است و برای این کار، یک تست تهاجمی مانند آمنیوسنتز استفاده میشود. در آمنیوسنتز، با فرو بردن یک سوزن نازک به داخل شکم مادر، سلولهای جنینی که در مایع اطراف نوزاد متولد نشده وجود دارد، جمعآوری میشود. از طرف دیگر، میتوان بافت را از جفت جمعآوری کرد (نمونهگیری از پرزهای جفت (chorionic villus sampling; CVS)). با استفاده از این تستهای تهاجمی، احتمال بیشتری وجود دارد که زنان باردار نوزاد خود را از دست بدهند، حتی اگر کودک مبتلا به سندروم داون نباشد. بنابراین، این تست تهاجمی فقط به زنانی پیشنهاد میشود که تصور میشود بیشتر احتمال دارد یک کودک متولد نشده مبتلا داشته باشند.
ما چه کاری انجام دادیم
ما مطالعاتی را جستوجو کردیم که زنانی را در هر سن، قومیت و سن بارداری که یک کودک یا بیش از یک کودک داشتند وارد کردند. مطالعاتی را جستوجو کردیم (تا جولای ۲۰۱۶) که دقت تست جدید را مورد ارزیابی قرار دادند.
آنچه ما به دست آوردیم
۶۵ مطالعه را با مجموع ۸۶,۱۳۹ زن باردار، شامل ۳۱۴۱ مورد بارداری مبتلا یافتیم. چهلودو مطالعه (۶۵%) زنان باردار با احتمال بالای داشتن نوزادان مبتلا به تعداد غیر‐طبیعی کروموزوم را به کار گرفتند. چهلوهشت مطالعه (۷۴%) فقط زنان با بارداری تکقلویی را وارد کردند. چهلوچهار مطالعه (۶۸%) از MPSS و ۲۱ مطالعه (۳۲%) از TMPS استفاده کردند.
به نظر میرسد که gNIPT برای غربالگری نوزادان متولد نشده (تکقلوها یا دوقلوها) دقیق باشد، مخصوصا برای تشخیص سندروم داون، تریزومی ۱۸ و تریزومی ۱۳. با این حال، در رابطه با چگونگی انجام مطالعات مشکلاتی وجود داشت که ما را در مورد یافتههایمان محتاط میسازد. این موضوع ممکن است باعث شود که نتایج gNIPT بهتر از آنچه هستند دیده شوند.
سایر اطلاعات مهم قابل بررسی
به نظر میرسد که روش gNIPT در شناسایی نوزادان متولد نشده با تعداد غیر‐طبیعی کروموزومها خوب عمل میکند. با این حال، هنگامی که gNIPT یک کروموزوم غیر‐طبیعی را تشخیص میدهد، پیش از اینکه بتوان درباره بارداری تصمیمگیری کرد استفاده از تستهای تهاجمی تایید شده (مانند آمنیوسنتز یا CVS) مورد نیاز هستند.
مهم است که اطلاعات کاملی به زنان باردار در مورد مشکلات احتمالی سلامت برای نوزادانی که دارای یک کروموزوم اضافی هستند داده شود. برای مثال، در سندروم داون، بعضی از کودکان دارای معلولیت قابل ملاحظهای هستند، بعضی دیگر میتوانند زندگی نسبتا نرمالی داشته باشند. علاوه بر این، در این مرور اغلب مطالعات، زنان باردار را با احتمال بالای داشتن نوزاد با تعداد غیر‐طبیعی کروموزوم به کار گرفتند، بنابراین یافتههای ما به طور مستقیم در جمعیت عمومی زنان باردار اعمال نمیشود.
سندروم داون (Down's syndrome) زمانی اتفاق میافتد که فردی به جای دو کپی، سه کپی از کوروموزوم شماره ۲۱ (یا ناحیه خاصی از کوروموزوم ۲۱ که منجر به بروز سندروم داون میشود) داشته باشد. این حالت شایعترین علت مادرزادی (congenital cause) کمتوانی ذهنی (mental disability) است. غربالگری غیر‐تهاجمی بر مبنای تجزیهوتحلیل بیوشیمیایی سرم (serum) یا ادرار (urine) مادر باردار، یا اسکنهای اولتراسوند جنین (fetal ultrasound measurements)، امکان تخمین خطر اثرپذیری بارداری را ایجاد کرده و اطلاعات لازم را برای هدایت تصمیمات درباره تستهای تعیین کننده فراهم میکند.
پیش از توافق روی تستهای غربالگری، نیاز است که والدین درباره خطرات، مزایا و عواقب احتمالی چنین تستی آگاه شوند. که عبارتند از: انتخابهای بعدی برای تستهای بیشتری که ممکن است پیشرو داشته باشند، و عواقب مربوط به هر دو حالت تست غربالگری مثبت کاذب (false positive) (یعنی تست تشخیصی تهاجمی و احتمال اینکه یک جنین سقط شده (miscarried fetus) ممکن است به لحاظ کوروموزومی نرمال باشد) و تست غربالگری منفی کاذب (false negative) (یعنی جنین مبتلا به سندروم داونی که تشخیص داده نخواهد شد). تصمیماتی که ممکن است پیشروی والدین در انتظار فرزند قرار گیرند، به صورت اجتنابناپذیری منجر به ایجاد سطح بالایی از اضطراب در تمامی مراحل فرآیند غربالگری شده و پیامدهای غربالگری میتواند موربیدیتیهای جسمی و روانی قابل ملاحظهای به دنبال داشته باشد. هیچ یک از تستهای غربالگری نمیتوانند شدت مشکلاتی را که فرد مبتلا به سندروم داون ممکن است با آن مواجه شود، پیشبینی کند.
بیستودو مطالعه (که در ۲۵ مستند منتشر شده گزارش شده بودند) شامل ۲۲۸,۶۱۵ مورد بارداری (شامل ۱۰۶۷ بارداری با سندروم داون) وارد مرور شدند. مطالعات به طور کلی از کیفیت بالایی برخوردار بودند؛ اگرچه تایید افتراقی به دنبال تست تهاجمی فقط میان بارداریهای با خطر بالا شایع بود. ده مطالعه به مقایسه مستقیم بین تستها پرداخته بودند. سیودو ترکیب مختلف از تستها ارزیابی شدند که از ترکیبی از هشت تست مختلف و سن مادر باردار تشکیل شده بودند؛ اسکن پشت گردنی (nuchal translucency; NT) سه ماهه اول و مارکرهای سرم AFP؛ uE۳؛ total hCG؛ free βhCG؛ Inhibin A؛ PAPP‐A و ADAM ۱۲. تستهای ترکیبی مارکرهای سه ماهه اول و دوم، با یا بدون اولتراسوند را به عنوان تستهای کامل جستوجو کردیم، استراتژیهای گام به گام (stepwise) و مشروط (contingent) را نیز بررسی کردیم.
متاآنالیز شش مورد از پرتکرارترین تستهای ترکیبی ارزیابی شده نشان داد که یک استراتژی تست شامل سن مادر باردار و ترکیبی از NT و PAPP‐A سه ماهه اول و total hCG؛ uE۳؛ AFP و Inhibin A سه ماهه دوم به طور معنیداری فراتر از تستهای ترکیبی دیگر که تنها یک مارکر سرم یا NT در سه ماه اول را در برمیگیرند، عمل میکنند، به طوری که تقریبا از هر ۱۰ بارداری سندروم داون نه مورد را، در نرخ مثبت کاذب ۵%، تشخیص میدهند. با وجود این، شواهد از نظر تعداد مطالعاتی که به ارزیابی این استراتژی پرداخته باشند کم بود، بنابراین ما نمیتوانیم یک استراتژی غربالگری واحد را توصیه کنیم.
پیشینه
سندروم داون (Down's syndrome) (که با عنوان داونز (Down's) یا تریزومی ۲۱ (Trisomy) نیز شناخته میشود) یک اختلال ژنتیکی غیر‐قابل درمان است که منجر به ایجاد مشکلات قابل توجه جسمی و روانی و ناتوانی میشود. با وجود این، تنوع وسیعی در چگونگی تاثیرگذاری داون روی افراد وجود دارد. برخی افراد به شدت تحت تاثیر این اختلال قرار میگیرند، در حالی که دیگران مشکلات خفیفتری داشته و میتوانند تقریبا به زندگی عادی خود ادامه دهند. هیچ راهی برای پیشبینی شدت تاثیرپذیری یک نوزاد از این اختلال وجود ندارد.
برای کمک به تصمیمگیری والدینی که در انتظار تولد فرزند خود هستند، این حق انتخاب داده میشود که از نظر ابتلا به سندروم داون در طول دوره بارداری تست شوند. در صورتی که مادری نوزاد مبتلا به سندروم داون داشته باشد، آنگاه درباره پایان دادن به بارداری یا ادامه آن باید تصمیم گرفته شود. این اطلاعات برای والدین فرصتی فراهم میکند که برای زندگی با وجود یک فرزند سندروم داون برنامهریزی کنند.
دقیقترین تستها برای تشخیص سندروم داون تست مایع اطراف نوزاد (آمنیوسنتز (amniocentesis)) یا بخشی از جفت (نمونهبرداری از پرزهای جفتی (chorionic villus sampling; CVS)) برای شناسایی کروموزومهای غیر‐عادی (abnormal chromosomes) مرتبط با سندروم داون است. هر دوی این تستها مستلزم فرو بردن سوزن به داخل شکم مادر بوده و گفته میشود که خطر سقط جنین را افزایش میدهند. بنابراین، این تستها ممکن است برای تمام زنان باردار مناسب نباشد. در مقابل، تستهایی که مارکرهای (markers) موجود را در خون یا ادرار مادر یا روی اسکنهای اولتراسوند (ultrasound scans) نوزاد اندازهگیری میکنند، برای غربالگری استفاده میشوند. این تستهای غربالگری ایدهآل نیستند، از آنجایی که میتوانند مواردی از ابتلا به سندروم داون به درستی تشخیص نداده و همچنین نتایج تست را با خطر بالا به تعدادی از مادرانی که نوزاد آنها تحت تاثیر سندروم داون قرار ندارند، ارائه دهد. بنابراین، بارداریهایی که بعد از استفاده از این تستهای غربالگری، خطر ابتلا در آنها بالا شناخته میشوند، برای تایید تشخیص سندروم داون، به انجام تستهای بیشتر با استفاده از آمنیوسنتز یا CVS نیاز پیدا میکنند.
ما چه کاری انجام دادیم
ما ترکیبی از تستهای غربالگری سرم سه ماهه اول (تا هفته ۱۴ بارداری) و دوم (تا هفته ۲۴ بارداری)، را با یا بدون تستهای غربالگری اولتراسوند سه ماهه اول ارزیابی کردیم، هدف ما شناسایی دقیقترین تست(ها) برای پیشبینی خطر تاثیرپذیری بارداری از سندروم داون بود. یک مارکر اولتراسوند (اسکن پشت گردنی (nuchal translucency)) و هفت مارکر سرم متفاوت (PAPP‐A؛ total hCG؛ free βhCG؛ uE۳؛ AFP؛ inhibin A؛ ADAM ۱۲) را که میتوانند به تنهایی، در نسبتها یا به صورت ترکیبی) پیش از هفته ۲۴ بارداری مورد استفاده قرار گرفته و بنابراین ۳۲ تست غربالگری برای سندروم داون ایجاد کنند، مورد بررسی قرار دادیم. ۲۲ مطالعه را شامل ۲۲۸,۶۱۵ بارداری (شامل ۱۰۶۷ جنین تحت تاثیر سندم داون) به دست آوردیم.
آنچه که ما به دست آوردیم
برای غربالگری سندروم داون، جایی که تستها در سه ماهه اول و دوم به اجرا درآمده و برای تخمین یک خطر کلی با هم ترکیب شدند، ما دریافتیم که یک تست مشتمل بر اسکن پشت گردنی و PAPP‐A سه ماهه اول و total hCG؛ uE۳؛ AFP و Inhibin A سه ماهه دوم، حساسترین تست بود، به طوری که از ۱۰ بارداری تاثیر پذیرفته از سندروم داون، نه مورد را تشخیص داده بود. پنج درصد از زنان بارداری که نتیجه تست آنها حاکی از خطر بالای ابتلا به این اختلال بود، بر اساس این ترکیب، تحت تاثیر سندروم داون قرار نخواهند داشت. تعداد مطالعاتی که به ارزیابی این تستها پرداخته بودند، کم بود و بنابراین ما نمیتوانیم درباره بهترین تست، توصیهای قوی ارائه دهیم.
سایر اطلاعات مهم قابل توجه
تستهای اولتراسوند به خودیخود هیچ نوع عوارضی جانبی برای زنان ندارند، و تستهای خون میتوانند ناراحتی، کبودی و به ندرت عفونت ایجاد کنند. با وجود این، برخی از زنانی که نتیجه تست غربالگری آنها نشان دهنده خطر بالایی است و برای آنها آمنیوسنتز یا CVS تجویز میشود، در معرض خطر سقط جنینی هستند که مبتلا به سندروم داون نیست. والدین نیاز دارند که در زمان تصمیمگیری برای انجام یا عدم انجام آمنیوسنتز یا CVS بعد از مشاهده نتیجه تست غربالگری با خطر بالا، به ارزیابی خطر مذکور بپردازند.
سندروم داون (Down's syndrome) زمانی اتفاق میافتد که فردی به جای دو کپی، سه کپی از کوروموزوم ۲۱ داشته باشد، یا ناحیه خاصی از کوروموزوم ۲۱ منجر به بروز سندروم داون میشود. این اختلال شایعترین علت مادرزادی (congenital cause) کمتوانی ذهنی (mental disability) است و همچنین منجر به بروز مشکلات ساختاری و متابولیکی فراوانی میشود. این اختلال میتواند زندگی فرد را تهدید کرده یا آسیبهای قابل توجهی را به دنبال داشته باشد، اگرچه برخی از افراد فقط دچار مشکلات خفیفی شده و میتوانند زندگی نسبتا عادی داشته باشند. داشتن یک کودک مبتلا به سندروم داون احتمالا تاثیر قابل توجهی بر زندگی خانواده دارد. غربالگری غیر‐تهاجمی بر مبنای تجزیهوتحلیل بیوشیمیایی سرم (serum) یا ادرار مادر باردار، یا اسکنهای اولتراسوند جنین (fetal ultrasound measurements)، امکان تخمین خطر اثرپذیری بارداری از این اختلال را فراهم کرده و اطلاعات لازم را برای هدایت تصمیمات درباره تستهای تعیین کننده ارائه میکند. پیش از توافق روی تستهای غربالگری، نیاز است که والدین به طور کامل از خطرات، مزایا و عواقب احتمالی چنین تستی آگاه شوند. که عبارتند از انتخابهای بعدی برای تستهای بیشتری که آنها ممکن است پیش رو داشته باشند، و عواقب مربوط به هر دو حالت تست غربالگری مثبت کاذب (false positive) و منفی کاذب (false negative) (یعنی تست تشخیصی تهاجمی و احتمال اینکه یک جنین سقط شده (miscarried fetus) ممکن است به لحاظ کوروموزومی نرمال باشد). تصمیماتی که ممکن است پیش روی والدین در انتظار فرزند (expectant parents) قرار گیرند، به صورت اجتنابناپذیری منجر به ایجاد سطح بالایی از اضطراب در تمامی مراحل فرآیند غربالگری شده و پیامدهای غربالگری میتواند موربیدیتی جسمی و روانی قابل ملاحظهای به دنبال داشته باشند. هیچ یک از تستهای غربالگری نمیتوانند شدت مشکلاتی را که فرد مبتلا به سندروم داون ممکن است با آن مواجه شود، پیشبینی کنند.
تخمین و مقایسه دقت مارکرهای اولتراسوند سه ماهه اول به تنهایی، و به صورت ترکیبی با تستهای سرم سه ماهه اول برای تشخیص سندروم داون.
۱۲۶ مطالعه (شامل ۱۵۲ نشریه) را با ۱,۶۰۴,۰۴۰ نوزاد (شامل ۸۴۵۴ مورد مبتلا به سندروم داون) وارد مرور کردیم. مطالعات به طور کلی از کیفیت بالایی برخوردار بودند؛ اگرچه تایید افتراقی به دنبال تست تهاجمی فقط میان بارداریهای پرخطر شایع بود. شصت ترکیب مختلف از تستها مورد ارزیابی قرار گرفتند که از ترکیبی از ۱۱ مارکر اولتراسوند متفاوت (اسکن پشت گردنی (nuchal translucency; NT)، استخوان بینی (nasal bone)، داپلر مجرای وریدی (ductus venosus Doppler)، طول استخوان فک بالا (maxillary bone length)، ضربان قلب جنین (fetal heart rate)، شریان سابکلاوین راست (aberrant right subclavian artery)، زاویه فرانتوماگزیلاری صورت (frontomaxillary facial angle)، وجود شکاف در دریچه میترال (presence of mitral gap)، برگشت خون از دریچه تریکوسپید (tricuspid regurgitation)، جریان خون تریکوسپید و زاویه ایلیاک ۹۰ درجه (iliac angle ۹۰ degrees)، ۱۲ تست سرم (inhibin A، آلفا‐فتوپروتئین (alpha‐fetoprotein; AFP)، زیر‐واحد بتای آزاد گونادوتروپین جفتی انسانی (free beta human chorionic gonadotrophin; ßhCG)، توتال گونادوتروپین جفتی انسانی (HCG)، پروتئین پلاسمایی A مرتبط با بارداری (pregnancy‐associated plasma protein A; PAPP‐A)، استریول کنژوگه نشده (unconjugated oestriol; uE۳)، دیساینتگرین (disintegrin) و متالوپروتئاز ۱۲ (metalloprotease ۱۲)، فاکتور رشد جفت (placental growth factor; PlGF)، هورمون رشد جفت (PGH)، آنتیژن تروفوبلاست تهاجمی (invasive trophoblast antigen; ITA)، (معادل HCG هیپرگلیکوزیله شده (hyperglycosylated HCG)، پروتئین متصل شونده به هورمون رشد (growth hormone binding protein; GHBP) و پروتئین ۱۳ جفتی (placental protein ۱۳; PP۱۳))؛ و سن مادر باردار تشکیل شده بودند. پرتکرارترین مارکرهای سرم ارزیابی شده به صورت ترکیبی با مارکرهای اولتراسوند عبارت بودند از PAPP‐A و free ßhCG.
مقایسه ۱۰ مورد از پرتکرارترین تست استراتژیهای ارزیابی شده نشان داد که تست استراتژی ترکیبی NT؛ PAPP‐A؛ free ßhCG و سن مادر باردار، به طور معنیداری دارای عملکردی فراتر از مارکرهای اولتراسوند به تنهایی (با یا بدون سن مادر باردار) به استثنای استخوان بینی است، به طوری که از هر ۱۰ بارداری سندروم داون در نرخ مثبت کاذب (false positive rate; FPR) ۵%، نه مورد تشخیص داده میشوند. در هر دو نوع مقایسههای مستقیم و غیر‐مستقیم، تست استراتژی ترکیبی NT؛ PAPP‐A؛ free ßhCG و سن مادر باردار نسبت به تست استراتژی NT و سن مادر باردار (P < ۰,۰۰۰۱) دارای دقت تشخیصی بالاتری بود. بر مبنای مقایسه غیر‐مستقیم تمامی مطالعات در دسترس از نظر این دو تست، حساسیت تخمینی (۹۵% فاصله اطمینان) در FPR ۵% برای ترکیب NT؛ PAPP‐A؛ free ßhCG و سن مادر باردار (۶۹ مطالعه؛ ۱,۱۷۳,۸۵۳ نوزاد شامل ۶۰۱۰ بارداری سندروم داون) ۸۷% (۸۶ تا ۸۹) و برای تست استراتژی NT و سن مادر باردار (۵۰ مطالعه؛ ۵۳۰,۸۷۴ نوزاد شامل ۲۷۰۱ بارداری سندروم داون) ۷۱% (۶۶ تا ۷۵) بود. ترکیب NT با سایر مارکرهای اولتراسوند، PAPP‐A و free ßhCG در یک یا دو مطالعه ارزیابی شده بودند و حساسیتها بیش از ۹۰% و ویژگی بیش از ۹۵% محاسبه شده بودند. جمعیتهای پرخطر (این جمعیتها عمدتا به دلیل سن بالای مادر باردار، ۳۵ سال یا بالاتر، یا بارداریهای قبلی با سابقه سندروم داون، پیش از اجرای غربالگری تعریف شده بودند) در مقایسه با جمعیتهای تحت غربالگری روتین در نرخ ۵% FPR نرخهای تشخیص کمتری نشان دادند. احتمال توصیه انجام تست تهاجمی برای تایید نتایج غربالگری منفی به زنانی که در گروه بالای ۳۵ سال سقط جنین داشتند بیشتر بود، در حالی که معمولا انجام تست تهاجمی برای نتیجه غربالگری منفی به زنان کمتر از ۳۵ سال توصیه نشده بود. بنابراین از دست دادن بارداری در زنان زیر ۳۵ سال منجر به عدم اطمینانبخش بودن نتایج غربالگری میشود، به طور بالقوه بخشی از بارداریهای آسیب دیده را از دست میدهد و حساسیت تست را تحت تاثیر قرار میدهد. بالعکس، در پنج مطالعه نرخهای تشخیص و نرخهای مثبت کاذب برای تست استراتژی NT؛ PAPP‐A؛ free ßhCG و سن مادر باردار با سن مادر باردار افزایش یافته بودند، و دادهها را به صورت جداگانه برای زیر‐گروه زنان ۳۵ ساله یا بیشتر ارائه کرده بودند.
پیشینه
سندروم داون (Down's syndrome) (که با عنوان داونز (Down's) یا تریزومی ۲۱ (Trisomy ۲۱) نیز شناخته میشود) یک اختلال ژنتیکی غیر‐قابل درمان است که منجر به ایجاد مشکلات قابل توجهی در جسم و روان و ناتوانی میشود. با وجود این، تنوع وسیعی در چگونگی تاثیرگذاری داون روی افراد وجود دارد. برخی افراد به شدت تحت تاثیر این اختلال قرار میگیرند، در حالی که دیگران مشکلات خفیفتری داشته و میتوانند تقریبا به زندگی عادی خود ادامه دهند. هیچ راهی برای پیشبینی شدت تاثیرپذیری یک نوزاد از این اختلال وجود ندارد.
برای کمک در تصمیمگیری، به والدینی که در انتظار تولد فرزند هستند، این حق انتخاب داده میشود که در طول دوره بارداری از نظر ابتلا به سندروم داون تست شوند. در صورتی که مادری نوزاد مبتلا به سندروم داون داشته باشد، آنگاه باید درباره پایان دادن به بارداری یا ادامه آن تصمیم گرفته شود. این اطلاعات برای والدین فرصتی فراهم میکند که برای زندگی با یک فرزند مبتلا به سندروم داون برنامهریزی کنند.
دقیقترین تستها برای سندروم داون را، تست مایع اطراف نوزاد (آمنیوسنتز (amniocentesis)) یا بخشی از بافت جفت (نمونهبرداری از پرزهای جفتی (chorionic villus sampling (CVS))) برای شناسایی کروموزومهای غیر‐عادی (abnormal chromosomes) مرتبط با سندروم داون دربرمیگیرد. هر دوی این تستها مستلزم فرو بردن سوزن به داخل شکم مادر بوده و گفته میشود که خطر سقط جنین (miscarriage) را افزایش میدهند. بنابراین، این تستها ممکن است برای تمام زنان باردار مناسب نباشد. در مقابل، تستهایی که مارکرهای (markers) موجود در خون یا ادرار مادر یا روی اسکنهای اولتراسوند (ultrasound scans) نوزاد را اندازهگیری میکنند، برای غربالگری استفاده میشوند. این تستهای غربالگری ایدهآل نیستند، از آنجایی که میتوانند مواردی از ابتلا به سندروم داون را به درستی تشخیص نداده و همچنین نتایج تست «پرخطر» را به تعدادی از مادرانی که نوزاد آنها تحت تاثیر سندروم داون قرار ندارند، ارائه دهد. بنابراین، بارداریهایی که بعد از استفاده از این تستهای غربالگری، خطر ابتلا در آنها بالا شناخته میشوند، برای تایید تشخیص سندروم داون، به انجام تستهای بیشتر با استفاده از آمنیوسنتز (از هفته ۱۵ بارداری) یا CVS (از هفته ۱۰+۰ تا ۱۳+۶ بارداری) نیاز پیدا میکنند.
آنچه ما انجام دادیم
هدف از این مرور جستوجوی آن دسته از تستهای غربالگری اولتراسوند سه ماهه اول، با یا بدون تستهای سرم سه ماهه اول بود که در طول ۱۴ هفته اول بارداری به اجرا درآمده و دارای بالاترین دقت در پیشبینی خطر بارداری سندروم داون هستند. ما ۱۱ مارکر اولتراسوند متفاوت و ۱۲ مارکر سرم متفاوت را که میتوانستند به تنهایی، در نسبتها یا به صورت ترکیبی پیش از هفته ۱۴ بارداری، مورد استفاده قرار گرفته و بنابراین ۶۰ تست غربالگری برای سندروم داون ایجاد کنند، بررسی کردیم. ۱۲۶ مطالعه را شامل ۱,۶۰۴,۰۴۰ نوزاد (شامل ۸۴۵۴ نوزاد مبتلا به سندروم داون) به دست آوردیم.
آنچه که ما به دست آوردیم
برای ۱۴ هفته اول بارداری، شواهد، از استفاده از تستهای اولتراسوند سه ماهه اول به صورت ترکیبی با دو مارکر سرم (خون)، به ویژه پروتئین پلاسمایی A مرتبط با بارداری (pregnancy‐associated plasma protein A; PAPP‐A) و زیر‐واحد بتای آزاد گونادوتروپین جفتی انسانی (free beta human chorionic gonadotrophin; ßhCG) و سن مادر باردار، برای غربالگری سندروم داون، حمایت میکند. در مجموع، این تستها به خودیخود بهتر از مارکرهای اولتراسوند هستند. آنها نه مورد از ۱۰ بارداری سندروم داون را تشخیص میدهند. پنج درصد از زنانی که این تستها را انجام میدهند، دارای خطر بالا در تست خواهند بود، با این وجود اکثر این بارداریها تحت تاثیر سندروم داون قرار نخواهند گرفت.
سایر اطلاعات مهم قابل بررسی
تستهای اولتراسوند به خودیخود هیچ نوع عوارضی جانبی روی زنان ندارند، و تستهای خون میتوانند ناراحتی، کبودی (bruising) و به ندرت عفونت ایجاد کنند. با این حال، برخی از زنانی که نتیجه تست غربالگری آنها نشان دهنده خطر بالایی است و برای آنها آمنیوسنتز یا CVS تجویز میشود، در معرض خطر سقط جنینی هستند که مبتلا به سندروم داون نیست. والدین نیاز دارند که در زمان تصمیمگیری برای انجام یا عدم انجام آمنیوسنتز یا CVS بعد از مشاهده نتیجه تست غربالگری با خطر بالا، به ارزیابی خطر مذکور بپردازند.
۱۰۱ مطالعه را شامل ۱۱,۰۰۳ شرکتکننده وارد کردیم که از میان آنها ۵۸۳۹ نفر (۵۳,۱%) مبتلا به عفونت H pylori بودند. شیوع عفونت H pylori در مطالعات بین ۱۵,۲% تا ۹۴.۷% و میانه شیوع آن ۵۳.۷% بود (دامنه بین‐چارکی ۴۲.۰% تا ۶۶.۵%). اکثر مطالعات (۵۷%) شامل شرکتکنندگان مبتلا به دیسپپسی بود و در ۵۳ مطالعه شرکتکنندگانی که اخیرا مهار کنندههای پمپ پروتونی (proton pump inhibitors) یا آنتیبیوتیک مصرف کرده بودند؛ از مطالعه حذف شدند. در هر مطالعه، حداقل یک مورد خطر سوگیری (bias) نامشخص یا نگرانی در مورد قابلیت کاربرد وجود داشت.
از ۱۰۱ مطالعه، ۱۵ مورد دقت دو تست شاخص و دو مطالعه صحت سه تست شاخص را با هم مقایسه کرده بودند. سیوچهار مطالعه (۴۲۴۲ شرکتکننده) به ارزیابی سرولوژی پرداخته بودند؛ ۲۹ مطالعه (۲۹۸۸ شرکتکننده) تست آنتیژن مدفوع را بررسی کرده بودند؛ ۳۴ مطالعه (۳۱۳۹ شرکت کننده) تست تنفسی اوره ۱۳C؛ ۲۱ مطالعه (۱۸۱۰ شرکتکننده) تست تنفسی اوره ۱۴C؛ و دو مطالعه (۱۲۷ شرکتکننده) تست تنفسی اوره را بدون آنکه ایزوتوپ استفاده شده را گزارش کنند، ارزیابی کرده بودند. آستانههای مورد استفاده برای تعریف مثبت بودن تست و تکنیکهای رنگآمیزی استفاده شده برای آزمایش هیستوپاتولوژیک (استاندارد مرجع) بین مطالعات متفاوت بود. با توجه به پراکنده بودن دادهها برای هر آستانه گزارش شده، امکان تعیین بهترین آستانه برای هر تست وجود نداشت.
با استفاده از دادههای حاصل از ۹۹ مطالعه در یک مقایسه غیر‐مستقیم، شواهد آماری در رابطه با تفاوت دقت تشخیصی بین تست تنفسی اوره ۱۳C، تست تنفسی اوره ۱۴C، سرولوژی و تست آنتیژن مدفوع وجود داشت (P = ۰,۰۲۴). نسبت شانس تشخیصی برای تست تنفسی اوره ۱۳C، تست تنفسی اوره ۱۴C، سرولوژی و تست آنتیژن مدفوع به ترتیب ۱۵۳؛ (۹۵% فاصله اطمینان (CI): ۷۳,۷ تا ۳۱۶)، ۱۰۵؛ (۹۵% CI؛ ۷۴.۰ تا ۱۵۰)، ۴۷.۴؛ (۹۵% CI؛ ۲۵.۵ تا ۸۸.۱) و ۴۵.۱؛ (۹۵% CI؛ ۲۴.۲ تا ۸۴.۱) بود. تخمین حساسیت (%۹۵ CI) با یک ویژگی ثابت ۰.۹۰ (میانه از چهار تست در طول مطالعات) به شرح زیر بود: ۰.۹۴ برای تست تنفسی اوره ۱۳C؛ (۹۵% CI؛ ۰,۸۹ تا ۰.۹۷)، ۰.۹۲ برای تست تنفسی اوره ۱۴C؛ (۹۵% CI؛ ۰,۸۹ تا ۰.۹۴)، ۰.۸۴ برای سرولوژی؛ (۹۵% CI؛ ۰.۷۴ تا ۰.۹۱)، و ۰.۸۳ برای تست آنتیژن مدفوع؛ (۹۵% CI؛ ۰.۷۳ تا ۰.۹۰). این بدان معناست که به طور میانگین، با توجه به ویژگی ۰.۹۰ و شیوع ۵۳.۷% (میانه ویژگی و شیوع در مطالعات)، از هر ۱۰۰۰ نفری که برای عفونت H pylori تست شدند، ۴۶ مورد مثبت کاذب وجود خواهد داشت (افراد بدون عفونت H pylori که مبتلا به عفونت H pylori تشخیص داده شوند). در این کوهورت فرضی، برای تست تنفسی اوره ۱۳C، تست تنفسی اوره ۱۴C، سرولوژی و تست آنتیژن مدفوع، میزان منفی کاذب (افراد مبتلا به عفونت H pylori که ابتلا به H pylori در آنها تشخیص داده نخواهند شد) به ترتیب ۳۰؛ (۹۵% CI؛ ۱۵ تا ۵۸)، ۴۲؛ (۹۵% CI؛ ۳۰ تا ۵۸)، ۸۶؛ (۹۵% CI؛ ۵۰ تا ۱۴۰) و ۸۹؛ (۹۵% CI؛ ۵۲ تا ۱۴۶) است.
مقایسههای مستقیم بر اساس چند مطالعه سربهسر صورت گرفته بود. مقادیر نسبت شانس تشخیصی (diagnostic odds ratios; DOR) برای مقایسه تست تنفسی اوره ۱۳C در برابر سرولوژی ۰,۶۸؛ (۹۵% CI؛ ۰.۱۲ تا ۳.۷۰؛ P = ۰.۵۶) (هفت مطالعه)، برای تست تنفسی اوره ۱۳C در برابر تست آنتیژن مدفوع ۰,۸۸؛ (۹۵% CI؛ ۰.۱۴ تا ۵.۵۶؛ P = ۰.۸۴) (هفت مطالعه) بود. ۹۵% CIها برای این تخمینها با مقادیر DORهای مقایسههای غیر‐مستقیم همپوشانی داشت. برای انجام متاآنالیز برای سایر مقایسههای مستقیم، دادهها محدود یا غیر‐قابل دسترس بودند.
در افراد بدون سابقه گاسترکتومی و کسانی که اخیرا آنتیبیوتیک یا مهار کننده پمپ پروتون استفاده نکردهاند، تست تنفسی اوره دقت تشخیصی بالایی برای تشخیص عفونت هلیکوباکترپیلوری داشت در حالی که تستهای سرولوژی و آنتیژن مدفوع دقت تشخیصی کمتری داشتند. این اطلاعات بر اساس مقایسه غیر‐مستقیم به دست آمدهاند (که به دلیل مخدوششدگی دادهها احتمال سوگیری در آنها وجود داشت)، زیرا شواهد مربوط به مقایسههای مستقیم محدود یا خارج از دسترس بود. آستانههای مورد استفاده برای این تستها بسیار متغیر بودند و ما قادر به شناسایی آستانههای خاصی که در عملکرد بالینی بتوان از آنها استفاده کرد، نبودیم.
برای به دست آوردن شواهد قابل اطمینان از دقت نسبی بین تستها، به مطالعات مقایسهای بیشتر با کیفیت روششناسی بالا نیاز داریم. چنین مطالعاتی باید به صورت آیندهنگر در طیف گستردهای از شرکتکنندگان انجام شود و به روشنی گزارش شود تا خطر پائین سوگیری را در پی داشته باشد. مهمتر از همه، مطالعات باید آستانههای استفاده شده را به طور واضح گزارش دهند و از استثناءهای نامناسب جلوگیری کنند.
چرا مهم است بدانیم که کسی مبتلا به عفونت هلیکوباکترپیلوری است؟
هلیکوباکتر پیلوری (Helicobacter pylori; H pylori) نوعی باکتری است که ممکن است در معده برخی افراد وجود داشته باشد. اعتقاد بر این است که H pylori باعث ایجاد برخی از سرطانها، از جمله سرطان معده، سرطان پانکراس و سرطان گلو میشود. همچنین H pylori با بیماریهای دیگری همچون زخم معده، سوزش سردل و احساس نفخ مرتبط است. اگرH pyloriدر فردی یافت شود، میتوان درمان مناسب آن را آغاز کرد.
هدف از انجام این مرور چیست؟
مقایسه دقت سه نوع تست مختلف برای تشخیص H pylori. این موارد عبارتند از: تستهای تنفسی اوره، تستهای خون (یک تست خون خاص به نام سرولوژی) و تست مدفوع (در مدفوع).
در این مرور چه موضوعی بررسی شد؟
دو نوع تست تنفسی اوره وجود دارد که در آنها از دو نوع مختلف کربن به نام ۱۳C و ۱۴C استفاده میشود، همچنین نسخههای متعددی از تستهای سرولوژی و مدفوع وجود دارد.
نتایج اصلی این مرور چه هستند؟
ما ۱۰۱ مطالعه پیدا کردیم که در مجموع ۱۱,۰۰۳ نفر را از نظر ابتلا به H pylori تست کرده بودند. از میان این ۱۱,۰۰۳ شرکتکننده، ۵۸۳۹ نفر (۵۳,۱%) مبتلا به عفونت H pylori بودند. همه این مطالعات از یکی از سه تستی که در بالا ذکر شد استفاده کرده و نتایج این تستها را با تشخیص از طریق بیوپسی آندوسکوپیک مقایسه کرده بودند. بیوپسی آندوسکوپی روشی است که در آن با استفاده از عبور یک لوله انعطافپذیر نازک از طریق دهان نمونهای از بافت معده گرفته شده و از نظر وجود H pylori زیر میکروسکوپ تست میشود. در حال حاضر این روش دقیقترین تست موجود است، اما باعث ناراحتی جسمی بیمار شده و مضراتی را به دنبال دارد. در مقابل، تستهای جایگزین غیر‐تهاجمی مورد بررسی در این مرور قرار دارند که به طور قابل توجهی کمتر ناراحت کننده هستند و کمترین میزان آسیب را وارد میکنند یا کاملا بیخطر هستند، که اگر مشخص شود دقت تشخیص H pylori همانند بیوپسی آندوسکوپی است، جایگزینهای مطلوبی برای آن محسوب میشوند. اکثر مطالعات شامل شرکتکنندگان مبتلا به سوزش سردل یا مشکلات مشابه در معده بودند و افرادی را که قبلا تحت جراحی برداشتن بخشی از معده قرار گرفته و کسانی را که درمان H pylori گرفته بودند، کنار گذاشته شدند.
سیوچهار مطالعه (۴۲۴۲ شرکت کننده) از سرولوژی استفاده کردند؛ ۲۹ مطالعه (۲۹۸۸ شرکتکننده) از تست آنتیژن مدفوع؛ ۳۴ مطالعه (۳۱۳۹ شرکتکننده) از تست تنفسی اوره ۱۳C؛ ۲۱ مطالعه (۱۸۱۰ شرکتکننده) از تست تنفسی اوره ۱۴C؛ و دو مطالعه (۱۲۷ شرکتکننده) از تست تنفسی اوره بدون مشخص کردن نوع کربن آن استفاده کرده بودند. محدودهای که پیش از مثبت اعلام کردن عفونت H pylori استفاده شده بود، و نیز نوع رنگآمیزی برای تست نمونه بیوپسی بین مطالعات مختلف بود. هنگامی که تمام دادهها را مورد بررسی قرار دادیم، دریافتیم که تستهای تنفسی اوره دقیقتر از تستهای خون و مدفوع بودند. این نتایج بدان معنی است که به طور میانگین، اگر ۱۰۰۰ نفر تست شوند، ۴۶ نفر بدون عفونت H pylori وجود دارند که به اشتباه مبتلا به عفونت H pylori تشخیص داده میشوند. همچنین ۳۰، ۴۲، ۸۶ و ۸۹ فرد مبتلا به عفونت H pylori وجود دارد که با استفاده از تستهای زیر عفونت H pylori در آنها تشخیص داده نشده است: به ترتیب؛ تست تنفسی اوره ۱۳C، تست تنفسی اوره ۱۴C، سرولوژی و تست آنتیژن مدفوع. هنگام بررسی هفت مطالعهای که تست تنفسی اوره ۱۳C و سرولوژی یا تست تنفسی اوره ۱۳C و تستهای آنتیژن مدفوع را در همان شرکتکنندگان با هم مقایسه کرده بودند، به نتایج نامطمئنی دست پیدا کردیم و نمیتوانیم بگوییم کدام تست دقیقتر است.
نتایج مطالعات تا چه حد قابل اعتماد هستند؟
به جز یک مطالعه، تمام مطالعات کیفیت روششناسی مطلوبی نداشتند، که باعث میشود نتایج آنها غیر‐قابل اعتماد باشد.
نتایج این مرور برای چه کسانی کاربرد دارد؟
این نتایج برای کودکان و بزرگسالان مشکوک به ابتلا به عفونت حاد H pylori اعمال میشود، اما فقط در کسانی که قبلا جراحی معده را انجام ندادهاند و افرادی که اخیرا آنتیبیوتیک یا درمان عفونت H pylori دریافت نکردهاند.
کاربردهای این مرور چه هستند؟
تستهای تنفسی اوره، خون و مدفوع ممکن است برای شناسایی اینکه فردی مبتلا به عفونت H pylori است یا خیر، مناسب باشند. با این حال، سطحی از نتیجه تست تنفسی اوره، تست خون، یا تست مدفوع که باید برای تشخیص عفونت H pylori استفاده شود، هنوز مشخص نیست.
این مرور تا چه زمانی بهروز است؟
برای دستیابی به مطالعاتی که در مورد میزان دقت این چند تست گزارشاتی ارائه کرده بودند، تا ۴ مارچ ۲۰۱۶ در تمامی منابع علمی جستوجو کردیم.
تعیین دقت تشخیصی میکروسکوپی کانفوکال بازتابی برای تشخیص ملانوم تهاجمی پوست و گونههای غیر‐معمول ملانوسیت داخل اپیدرم در بزرگسالان دارای هرگونه ضایعه مشکوک به ملانوم و ضایعاتی که تشخیص آنها دشوار است و مقایسه دقت آن با درموسکوپی.
این جستوجو ۱۸ مطالعه منتشر شده را از ۱۹ مطالعه کوهورت با ۲۸۳۸ ضایعه (از جمله ۶۵۸ مورد با ملانوم) شناسایی کرد، که شامل ۶۷ مجموعه دادهای برای RCM و هفت مجموعه دادهای برای درموسکوپی بود. مطالعات تقریبا در تمام حوزهها بهطور کلی در معرض خطر بالا یا نامشخص سوگیری (bias) قرار داشته و در رابطه با قابلیت کاربرد شواهد، نگرانیهای زیاد یا نامشخصی وجود داشت. به کارگیری انتخابی شرکتکننده، عدم کورسازی تست مرجع نسبت به نتیجه RCM، و بررسی افتراقی بهویژه مشکلساز بودند. این مطالعات ممکن است نمایندهای از جمعیت مناسب برای RCM نباشند، و تفسیر تست اغلب دور از بیمار انجام شده و نسبت به اطلاعات بالینی کورسازی شده بود.
در مطالعات مربوط به شرکتکنندگان با هر گونه ضایعه مشکوک به ملانوم و شرکتکنندگان با ضایعاتی که تشخیص آنها دشوار است (جمعیت دارای ضایعه مشکوک) متاآنالیز، RCM را دقیقتر از درموسکوپی تشخیص داد. با فرض حساسیت ثابت ۹۰% برای هر دو تست، ویژگی برای RCM برابر با ۸۲% و برای درموسکوپی در هر نوع ضایعه مشکوک به ملانوم، ۴۲% بود (۹ مجموعه داده برای RCM؛ ۱۴۵۲ ضایعه و ۳۷۰ ملانوم). در یک جمعیت فرضی با ۱۰۰۰ ضایعه و میانه معادل ۳۰% برای شیوع مشاهده شده ملانوم، این میزان با کاهش در برداشتهای غیر‐ضروری با RCM برابر با ۲۸۰ مورد، در مقایسه با درموسکوپی، با ۳۰ مورد ملانوم از دست رفته در هر دو تست، برابر است. برای مطالعات مربوط به ضایعات مشکوک، ویژگی برای RCM برابر با ۸۶% و برای درموسکوپی ۴۹% مشاهده شد (۷ مجموعه دادهای برای RCM؛ ۱۱۷۷ ضایعه و ۱۸۰ ملانوم). در میانه ۲۰% از شیوع مشاهده شده ملانوم، این کار برداشتهای غیر‐ضروری را با RCM به میزان ۲۹۶ مورد در مقایسه با درموسکوپی، با ۲۰ مورد ملانوم از دست رفته در هر دو تست، کاهش داد. در تمامیجمعیتها، الگوریتمها و آستانههای ارزیابی شده، حساسیت و ویژگی نمره Pellacani RCM در آستانه سه یا بیشتر، ۹۲% (۹۵% فاصله اطمینان (CI): ۸۷ تا ۹۵ برای RCM و ۷۲% (۹۵% CI؛ ۶۲ تا ۸۱) برای درموسکوپی برآورد شد.
هدف از این مرور چیست؟
هدف از این مرور کاکرین پاسخ به این سوال بود که در تشخیص ملانوم، میکروسکوپی کانفوکال بازتابی (reflectance confocal microscopy; RCM) بهتنهایی و هنگام استفاده همراه با درموسکوپی در مقایسه با درموسکوپی بهتنهایی، چقدر دقیق بود. نویسندگان مرور در کاکرین ۱۸ مطالعه را برای پاسخ به این سوال وارد کردند.
چرا بهبود تشخیص ملانوم مهم است؟
ملانوم یکی از خطرناکترین انواع سرطان پوست است. عدم تشخیص ملانوم در صورت وجود (نتیجه تست منفی‐کاذب نامیده میشود)، عمل جراحی را برای برداشتن آن به تاخیر میاندازد، خطر گسترش سرطان را به سایر قسمتهای بدن و احتمالا مرگ را افزایش میدهد. تشخیص یک ضایعه پوستی به عنوان ملانوم در صورت عدم وجود (نتیجه مثبت‐کاذب نامیده میشود) ممکن است منجر به انجام جراحی غیر‐ضروری، تحقیقات بیشتر، و اضطراب بیمار شود.
این مرور چه موضوعی را بررسی کرد؟
تکنیکهای میکروسکوپی توسط متخصصان سرطان پوست به منظور بررسی جزئیتر و دقیقتر ضایعات پوستی مشکوک استفاده میشود که فقط با چشم غیر‐مسلح دیده میشوند. در حال حاضر، درموسکوپی (یک دستگاه دستی که از نور طبیعی استفاده میکند) میتواند به عنوان بخشی از معاینه بالینی ضایعات پوستی مشکوک مورد استفاده قرار گیرد. RCM یک تکنیک میکروسکوپی جدید است (یک دستگاه دستی یا یک دستگاه استاتیک (ایستا) که از نور مادون قرمز استفاده میکند) که میتواند لایههای عمیقتر پوست را نسبت به درموسکوپی نشان دهد. هر دو تکنیک روشهای بدون درد هستند، اما RCM گرانتر و وقتگیر است و نیاز به آموزشهای بیشتری دارد. درموسکوپی میتواند توسط پزشکان عمومی مورد استفاده قرار گیرد در حالی که RCM احتمالا فقط توسط متخصصان مراقبتهای ثانویه در افرادی که با یک ضایعه مشکوک به سرطانی بودن ارجاع داده شدهاند، استفاده میشود. ما به دنبال کشف این موضوع بودیم که RCM باید به جای، یا به همراه، درموسکوپی برای تشخیص ملانوم در هر ضایعه پوستی مشکوک یا فقط برای ضایعات پوستی که تشخیص آنها بسیار دشوار است، مورد استفاده قرار گیرد.
نتایج اصلی این مرور چه بودند؟
این مرور شامل ۱۸ مطالعه حاوی دادههای مربوط به ۱۹ گروه از شرکتکنندگان مبتلا به ضایعات مشکوک به ملانوم بود. نتایج اصلی بر اساس ۱۶ مورد از ۱۹ مجموعه اطلاعاتی (مجموعهای از اطلاعات و نتایج) بیان شدند.
این مرور شامل نه مجموعه دادهای با ۱۴۵۲ ضایعه در افراد دارای ضایعه پوستی مشکوک بود، که سه مورد از آنها RCM را با درموسکوپی مقایسه کردند. نتایج نشان دادند که در هر ۱۰۰۰ ضایعه، که ۳۰۰ مورد (۳۰%) از آنها در واقع ملانوم هستند:
‐ ۳۹۶ مورد دارای نتیجه RCM هستند که نشاندهنده وجود ملانوم است، و از این تعداد، ۱۲۶ مورد (۳۲%) ملانوم نخواهد بود (نتایج مثبت‐کاذب)؛
‐ در همان گروه از ۱۰۰۰ ضایعه، درموسکوپی ۴۰۶ نتیجه مثبت‐کاذب ارائه خواهد کرد، به این معنی که RCM از جراحی غیر‐ضروری در ۲۸۰ مورد ضایعه در مقایسه با درموسکوپی جلوگیری خواهد کرد؛
‐ از ۶۰۴ ضایعه با یک نتیجه RCM که نشان میدهد ملانوم وجود ندارد (و ۳۲۴ ضایعه با نتایج درموسکوپی که نشان میدهد ملانوم وجود ندارد)، ۳۰ مورد در واقع ملانوم خواهد بود (نتایج منفی‐کاذب). این میزان معادل با نرخ منفی‐کاذب ۵% برای RCM و ۹% برای درموسکوپی است.
این مرور همچنین شامل هفت مجموعه دادهای با ۱۱۷۷ ضایعه در افراد دارای ضایعات پوستی بود که به دشواری تشخیص داده میشوند، سه مورد از آنها RCM را با درموسکوپی مقایسه کردند. نتایج نشان دادند که اگر متخصصان پوست در یک گروه با ۱۰۰۰ ضایعه از RCM استفاده کنند، ۲۰۰ مورد (۲۰%) در واقع ملانوم خواهد بود:
‐ در ۲۹۲ مورد که نتیجه RCM آنها نشان دهنده وجود ملانوم است، تعداد ۱۱۲ مورد (۳۸%) ملانوم نخواهد بود (نتایج مثبت‐کاذب)؛
‐ در همان گروه از ۱۰۰۰ ضایعه، درموسکوپی منجر به ۴۰۸ نتیجه مثبت‐کاذب خواهد شد، به این معنی که RCM از جراحی غیر‐ضروری در ۲۹۶ ضایعه در مقایسه با درموسکوپی جلوگیری خواهد کرد؛
‐ از ۷۰۸ ضایعه با یک نتیجه RCM نشان دهنده عدم وجود ملانوم (و ۴۱۲ ضایعه با نتیجه درموسکوپی که نشان داده ملانوم وجود ندارد)، ۲۰ مورد در واقع ملانوم نخواهد بود (نتایج منفی‐کاذب). این میزان برابر با ۳% نرخ منفی‐کاذب برای RCM و ۵% برای درموسکوپی بود.
نتایج مطالعات این مرور چقدر قابل اعتماد بودند؟
در تمام مطالعات وارد شده، تشخیص ملانوم از طریق بیوپسی ضایعه (درموسکوپی/RCM مثبت) انجام شد (بیوپسی شامل نمونهبرداری از سلولهای بدن و بررسی آنها زیر میکروسکوپ بود)، و عدم وجود ملانوم با بیوپسی تائید شد یا با پیگیری با گذشت زمان که میتوان مطمئن شد ضایعه پوستی از نظر ملانوم منفی بود (درموسکوپی/RCM مثبت)*. این احتمالا یک روش قابل اعتماد برای تصمیمگیری درباره این موضوع است که افراد واقعا مبتلا به ملانوم بودند یا خیر. فقط تعداد کمی از مطالعات دقت درموسکوپی و RCM را مقایسه کردند. اکثر آنها توسط تیم تحقیقاتی متخصص و با سطح بالایی از تجربه با RCM انجام شدند. بنابراین، RCM ممکن است دقیقتر از آنچه که در واقع بود، به نظر برسد. شرکتکنندگان در نه مطالعه با هرگونه ضایعه مشکوک ممکن است بیماری بسیار آشکاری در مقایسه با آنچه که در عمل دیده میشود داشته باشند و منجر به کاهش تعداد نتایج مثبت‐کاذب، نسبت به آنچه در واقع رخ میدهد، شود. به دلیل تفاوت بین مطالعات، ارائه تعریفی از تست مثبت RCM که نتایج قابل اعتمادی را در اینجا ارائه کند، امکانپذیر نیست.
نتایج این مرور برای چه کسانی قابل کاربرد است؟
یازده مطالعه در اروپا (۶۱%)، و سایر مطالعات در اقیانوسیه، آمریکای شمالی، یا در بیش از یک قاره انجام شدند. میانگین سنی شرکتکنندگان بین ۳۹ تا ۵۴,۷ سال بود. درصد افراد مبتلا به ملانوم بین ۱.۹% و ۴۱.۵% (میانه (نقطه میانی) ۱۹% برای ضایعات پوستی دشوار برای تشخیص و ۳۲% برای هر گونه ضایعه مشکوک) گزارش شد. اکثر مطالعات فقط شامل افرادی با انواع خاصی از ضایعات پوستی بودند. در بسیاری از مطالعات، مشخص نیست که شرکتکنندگان قبل از RCM چه تستی را دریافت کردند.
کاربردهای این مرور چه هستند؟
به نظر میرسد RCM یک تست دقیق برای شناسایی ملانوم باشد و ممکن است تعداد افراد دریافت کننده عمل جراحی غیر‐ضروری را در مقایسه با درموسکوپی تا سه‐چهارم کاهش دهد. وجود تفاوتهای قابلتوجه و عدم قطعیت در نتایج و انجام مطالعه، منجر به کاهش قابلیت اطمینان یافتهها شد. استفاده از RCM ممکن است در افرادی که دارای ضایعاتی با تشخیص بسیار دشوار هستند، به جای افرادی که دارای ضایعات مشکوک به ملانوم هستند، منفعت بیشتری را به همراه داشته باشد. برای مقایسه RCM و درموسکوپی در گروههای به خوبی توصیف شدهای که تشخیص ضایعات پوستی در آنها دشوار است، انجام تحقیقات بیشتری مورد نیاز است.
این مرور تا چه تاریخی بهروز است؟
نویسندگان مرور به جستوجو و استفاده از مطالعاتی پرداختند که تا آگوست ۲۰۱۶ منتشر شدند.
* در این مطالعات، بیوپسی یا پیگیری بالینی، مرجع استاندارد (ابزار تائید تشخیص نهایی) بودند.
دو نویسنده مرور بهطور مستقل از هم تمام دادهها را با استفاده از فرم استاندارد شده استخراج داده و ارزیابی کیفیت (بر اساس QUADAS‐۲) استخراج کردند. در جایی که امکانپذیر بود، با استفاده از مدل سلسله مراتبی دو متغیره (bivariate hierarchical model)، حساسیتها و ویژگیهای خلاصه را تخمین زدیم.
چرا بهبود تشخیص سرطان پوست مهم است؟
چندین نوع سرطان پوست مختلف وجود دارد. شایعترین آنها کارسینوم سلول بازال (basal cell carcinoma; BCC) است. BCC یک سرطان موضعی است که میتواند رشد کرده و پوست اطراف ضایعه را تخریب کند. آنها به ندرت مانند سایر سرطانها در داخل بدن گسترش مییابند. BCCهای کمخطر سطحی یا کوچک میتوانند بهطور کلی به جای جراحی، با درمانهایی مانند کرمها درمان شوند، در حالی که بهتر است BCCهایی که بیشتر احتمال دارد رشد کرده و گسترش یابند، از طریق جراحی برداشته شوند. در صورتی که BCCها بسیار بزرگ باشند یا امکان برداشتن آنها از طریق جراحی وجود نداشته باشد، پرتودرمانی (درمانی که در آن از تابش/اشعه برای کشتن سلولهای سرطانی استفاده میشود) نیز میتواند مورد استفاده قرار گیرد. کارسینوم سلول سنگفرشی پوست (cutaneous squamous cell carcinoma; cSCC) نیز معمولا یک سرطان موضعی پوست است. این نوع از سرطان در درصد اندکی از موارد ممکن است به سایر قسمتهای بدن گسترش یابد، بنابراین بهترین درمان برداشتن آن از طریق جراحی است. ملانوم (melanoma) یکی از خطرناکترین انواع سرطان پوست است زیرا پتانسیل بالایی برای گسترش به سایر قسمتهای بدن دارد، و از این رو، تشخیص و برداشتن زودهنگام آن حیاتی است. اگر افراد مبتلا به BCC تشخیص درستی دریافت نکنند (نتیجه تست منفی‐کاذب نامیده میشود)، درمان آنها میتواند به تعویق افتد و پروسیجر جراحی پیچیدهتر شود. تشخیص BCC زمانی که در واقع چیزی دیگری است (نتیجه مثبت‐کاذب) ممکن است منجر به درمان غیر‐‐ضروری، جراحی یا سایر بررسیها و در نهایت، منجر به استرس و اضطراب بیمار شود. اگر BCC در فردی که در واقع دارای یک cSCC یا ملانوم است به درستی تشخیص داده نشود، درمان موثر میتواند به تاخیر افتد و این امر ممکن است منجر به افزایش احتمال گسترش cSCC یا ملانوم به سایر اندامهای بدن شود، که میتوانند بسیار جدی باشند.
هدف از انجام این مرور چیست؟
هدف از این مرور کاکرین این بود که بدانیم تکنیکی که «سیتولوژی اگزفولیاتیو (exfoliative cytology)» نامیده میشود برای تشخیص سرطان پوست چقدر دقیق است. محققان در کاکرین نه مطالعه را برای پاسخ به این سوال یافتند. نه مطالعه مربوط به تشخیص BCC، دو مطالعه در رابطه با تشخیص cSCC و یک مطالعه در رابطه با تشخیص ملانوم صورت گرفتند.
در این مرور چه موضوعی بررسی شد؟
سیتولوژی اگزفولیاتیو به معنی اسکراپ سطح مشکوک به سرطان پوست با چاقو و سپس قرار دادن لایه کوچکی از سطح اسکراپ شده روی یک اسلاید شیشهای است تا سلولهای موجود در اسکراپ رنگآمیزی شده و زیر یک میکروسکوپ بررسی شوند. این عمل نسبت به بیوپسی پوست کمتر تهاجمی است و به سرعت انجام میشود، و نتایج بلافاصله در دسترس قرار میگیرند. این کار میتواند بیماران را از ویزیت اضافی در کلینیک برای دریافت نتایج بیوپسی پوست بینیاز کند.
نتایج اصلی این مرور چه هستند؟
در این مرور نه مطالعه در مجموع با ۱۶۵۵ ضایعه (یک خال یا ناحیه از پوست با ظاهر غیر‐معمول در مقایسه با پوست اطراف) مورد بررسی قرار گرفت تا تشخیصهای نهایی ارائه شود*: ۱۱۲۰ مورد BCCs؛ ۴۱ مورد cSCCs و ۱۰ مورد ملانوم.
برای شناسایی BCC، هفت مطالعه تاثیر استفاده از سیتولوژی اگزفولیاتیو را برای تایید BCC در ضایعاتی که پزشکان در حال حاضر مشکوک به BCC بودن آنها بودند، نشان میدهند. در یک گروه با ۱۰۰۰ مورد از چنین ضایعاتی، که ۸۶۰ مورد (۸۶%) در واقع BCC دارند، بنابراین:
‐ تخمین زده شده که ۸۵۳ نفر یک نتیجه سیتولوژی اگزفولیاتیو خواهند داشت که وجود BCC را تایید کند. از این تعداد ۱۴ مورد (۱۶%) در واقع BCC نخواهند داشت (نتیجه مثبت‐کاذب)؛
‐ از ۱۴۷ نفر با نتیجه سیتولوژی اگزفولیاتیو نشان میدهد که BCC وجود ندارد، ۲۱ مورد (۱۴%) در حقیقت واقعا BCC دارند (نتیجه منفی‐کاذب).
یک مطالعه دقت سیتولوژی اگزفولیاتیو را با استفاده از میکروسکوپ دستی (درموسکوپی) برای تشخیص BCC مقایسه کرد اما از روشهای مختلفی برای برداشتن سلولها استفاده و بیمارانی را انتخاب کرد که در معرض خطر بالاتر ملانوم نسبت به هشت مطالعه دیگر بودند.
شواهد کافی برای تعیین دقت سیتولوژی اگزفولیاتیو برای تشخیص cSCC یا ملانوم وجود نداشت.
نتایج مطالعات این مرور چقدر قابل اعتماد هستند؟
تعداد کم مطالعات وارد شده در این مرور، توصیف ضعیف از چگونگی انتخاب بیماران در این مطالعه، و اطلاعات محدود از نحوه استفاده از نتایج این تست برای تشخیص، باعث کاهش قابلیت اطمینان نتایج ما شد.
این مطالعات در مورد اینکه چگونه بیماران به تست سیتولوژی اگزفولیاتیو ارجاع داده شدند، توضیحی ارائه نکردند. از همه مهمتر اینکه، این تست فقط در افرادی استفاده شد که پزشکان قبلا از طریق نگاه به ضایعه پوستی BCC را تشخیص داده بودند. به عبارت دیگر، این تست برای تایید تشخیص پزشک مورد استفاده قرار گرفت. اکثر مطالعات افراد کافی را که دارای ضایعات پوستی با ظاهری مشابه با BCC هستند، انتخاب نکردند تا مطمئن شوند که این تست به درستی BCC را شناسایی میکند. این امر ممکن است باعث شود که سیتولوژی اگزفولیاتیو دقیقتر از آنچه که در عمل واقعی است، به نظر برسد.
نتایج این مرور برای چه کسانی کاربرد دارد؟
مطالعات در انگلستان، اروپا و استرالیا انجام شدند. نویسندگان مطالعه به ندرت ویژگیهای بیمار، مانند سن و محل ضایعه را توصیف کردند. درصد افرادی که در مطالعات با تشخیص نهایی BCC وارد شدند بین ۱۸% تا ۹۰% بودند (نه مطالعه). این میزان برای cSCC برابر با ۴% و ۱۸% (دو مطالعه)، و برای ملانوم ۵% (یک مطالعه) بود. بر اساس مطالعات انجام شده اینکه بتوان گفت پزشکان چگونه تصمیم گرفته بودند که شرکتکنندگان مطالعه دارای ضایعه ممکن بود سرطان پوست داشته باشند، امکانپذیر نبود.
کاربردهای این مرور چه هستند؟
در هیچ یک از پژوهشها برای تشخیص سرطان پوستی که در آن بیمار برای اولین بار توسط یک پزشک معاینه میشد، از سیتولوژی اگزفولیاتیو استفاده نشد. نتایج این مرور نشان میدهد که سیتولوژی اگزفولیاتیو میتواند به تایید BCC در بیماران دارای ضایعات پوستی که پزشک در حال حاضر به BCC بودن آن مشکوک است، کمک کند. این تست میتواند برای بیماران مبتلا به BCC نیازمند به درمانهای غیر‐جراحی مانند پرتودرمانی مفید باشد، تشخیص بافت پیش از درمان باید مورد توجه قرار گیرد.
این مرور تا چه زمانی بهروز است؟
نویسندگان مرور به جستوجو و استفاده از مطالعاتی پرداختند که تا آگوست ۲۰۱۶ منتشر شدند.
*در این مطالعات، بیوپسی استاندارد مرجع (ابزار تایید تشخیص نهایی) بود.
این مرور ۲۲ مطالعه را وارد کرد که دقت تشخیصی دادههای مربوط به ۴۰۵۷ ضایعه و ۸۷۹ مورد بدخیم (۱۶ مطالعه) و دادههای دقیق ارجاع را برای دادههای گزارش شده در مورد ۱۴۴۹ ضایعه و ۲۷۰ مورد «مثبت» توسط تصمیم استاندارد مرجع رو‐در‐رو (شش مطالعه) گزارش کردند. کیفیت روششناسی با توجه به گزارشدهی ضعیف که مانع ارزیابی شد، متغیر بود. خطر کلی سوگیری (bias) برای انتخاب شرکتکننده، استاندارد مرجع و جریان شرکتکننده و زمانبندی در حداقل نیمی از تمام مطالعات، بالا یا نامشخص بود؛ اغلب مطالعات از نظر تست شاخص در معرض خطر پائین سوگیری قرار داشتند. قابلیت کاربرد یافتههای مطالعه به دلیل اینکه اغلب مطالعات در تمام حوزههای ارزیابی شده شرکتکنندگان را از مراکز مراقبتهای ثانویه یا کلینیکهای تخصصی به جای مراکز مراقبتهای اولیه و مبتنی بر اجتماع به کار گرفته بودند که بسیار احتمال داشت در آنها تلهدرماتولوژی مورد استفاده قرار بگیرد و به دلیل گرفتن تصاویری از ضایعه توسط درماتولوژیست یا در مراکز تخصصی تصویربرداری به جای متخصصین مراقبتهای اولیه، در معرض نگرانی بالا یا نامشخصی قرار داشتند.
هفت مطالعه دادههایی را مربوط به شرایط هدف اولیه هر نوع سرطان پوست ارائه کردند (۱۵۸۸ ضایعه و ۶۳۸ مورد بدخیم). برای تشخیص صحیح ضایعات به عنوان بدخیم با استفاده از تصاویر فتوگرافیک، خلاصه حساسیت ۹۴,۹% (۹۵% فاصله اطمینان (CI)؛ ۹۰.۱% تا ۹۷.۴%) و خلاصه ویژگی ۸۴.۳%؛ (۹۵% CI؛ ۴۸.۵% تا ۹۶.۸%) بود (از چهار مطالعه). تخمین مطالعه مجزا با استفاده از تصاویر درموسکوپیک یا ترکیبی از تصاویر فوتوگرافیک و درموسکوپیک عموما حساسیتهای بالا را با ویژگی بسیار متغیری نشان داد. دادههای مقایسهای محدود، دقت تشخیصی مشابهی را بین ارزیابی تلهدرماتولوژی و تشخیص فردی توسط یک درماتولوژیست نشان داد؛ با این حال، دادهها برای نتیجهگیریهای قطعی بسیار نادر بودند. حساسیتها و ویژگیها برای تشخیص ملانوم تهاجمی یا گونههای غیر‐معمول ملانوسیت داخل اپیدرم بسیار متغیر بودند. حساسیتها بین ۵۹%؛ (۹۵% CI؛ ۴۲% تا ۷۴%) تا ۱۰۰%؛ (۹۵% CI؛ ۴۸% تا ۱۰۰%) و ویژگی بین ۳۰%؛ (۹۵% CI؛ ۲۲% تا ۴۰%) تا ۱۰۰%؛ (۹۵% CI؛ ۹۳% تا ۱۰۰%)، با آستانههای تشخیصی گزارش شده از جمله تشخیص صحیح ملانوم، طبقهبندی ضایعات به عنوان «غیر‐معمولی» یا «معمولی» و تصمیم به ارجاع یا برداشتن ضایعه بود.
دادههای دقت ارجاع در مقایسه تلهدرماتولوژی در برابر یک استاندارد مرجع رو‐در‐رو، توافق خوبی برای ضایعاتی در نظر گرفته شد که نیاز به چند عمل مثبت با ارزیابی رو‐در‐رو دارند (حساسیتهای بیش از ۹۰%). هنگام ارزیابی رو‐در‐رو ضایعاتی که نگرانی کمتری در مورد آنها وجود دارد (به عنوان مثال برای ضایعاتی که اکسیزیون یا ارجاع برای آنها توصیه نمیشود)، توافق با ویژگیهای تلهدرماتولوژی که از ۵۷%؛ (۹۵% CI؛ ۳۹% تا ۷۳%) تا ۱۰۰%؛ (۹۵% CI؛ ۸۶% تا ۱۰۰%) بسیار متغیر بود، نشان میدهد که ارزیابی از راه دور به احتمال زیاد برداشتن ضایعه، ارجاع یا پیگیری را در مقایسه با تصمیمات شخصی توصیه میکند.
چرا بهبود تشخیص سرطان پوست مهم است؟
انواع مختلفی از سرطان پوست وجود دارد. ملانوم (melanoma) یکی از خطرناکترین انواع سرطان است و شناسایی زودهنگام آن مهم است تا بتوان آن را برداشت. اگر هنگام اولین مراجعه به پزشکان تشخیص داده نشود (تحت عنوان یک نتیجه تست منفی کاذب نیز شناخته میشود) درمان ممکن است به تعویق افتاده و باعث انتشار ملانوم به سایر اعضای بدن و احتمالا باعث مرگومیر زودهنگام شود. کارسینوم سلول سنگفرشی پوست (cutaneous squamous cell carcinoma; cSCC) و کارسینوم سلول پایهای (basal cell carcinoma; BCC) معمولا سرطان موضعی پوست هستند، با این حال cSCC ممکن است به سایر قسمتهای بدن گسترش یابد و BCC ممکن است در صورت عدم تشخیص زودهنگام منجر به بدشکلی شود. نامیدن چیزی به نام سرطان پوست، زمانی که در واقع سرطان پوست نیست (یک نتیجه مثبت کاذب) ممکن است منجر به جراحی غیر‐ضروری و تحقیقات دیگری شود که باعث ایجاد استرس و نگرانی برای بیمار شود. تشخیص صحیح مهم است. تشخیص اشتباه یک سرطان پوست میتواند منجر به درمان اشتباه یا منجر به تاخیر در درمان موثر شود.
هدف از انجام این مرور چیست؟
هدف از این مرور کاکرین این بود که بدانیم تلهدرماتولوژی برای شناسایی افرادی که دارای ضایعات پوستی نیازمند ارجاع به یک متخصص درماتولوژیست (پزشک مربوط به بیماری پوست) هستند به اندازه کافی دقیق است یا خیر و اینکه چه کسی میتواند اطمینان بدهد که ضایعه آنها (آسیب یا تغییر پوست) بدخیم نیست. ۲۲ مطالعه را برای پاسخ به این سوال وارد کردیم.
در این مرور چه موضوعی بررسی شد؟
تلهدرماتولوژی به معنی ارسال تصاویر ضایعات پوستی یا بثورات به متخصص پوست برای مشاوره در تشخیص یا مدیریت است. این یک راه برای پزشکان مراقبتهای اولیه (پزشکان عمومی (general practitioners; GPs)) است تا نظر متخصص درماتولوژیست را بدون ارجاع بیماران از طریق روش طبیعی ارجاع به دست بیاورند. این روش درمان میتواند شامل ارسال عکس یا تصاویر بزرگ از یک ضایعه پوستی گرفته شده با یک دوربین خاص (درماتوسکوپ) به یک متخصص پوست برای دیدن یا ممکن است شامل بحث فوری در مورد ضایعه پوستی بین یک GP و یک متخصص پوست با استفاده از ویدئوکنفرانس باشد.
نتایج اصلی این مرور چه هستند؟
این مرور شامل ۲۲ مطالعه بود، ۱۶ مطالعه که به مقایسه تشخیصهای تلهدرماتولوژی با تشخیصهای قطعی نهایی (دقت تشخیصی) برای ۴۰۵۷ ضایعه و ۸۷۹ مورد بدخیم پرداختند و پنج مطالعه به مقایسه تصمیمات تلهدرماتولوژی با تصمیماتی پرداختند که با حضور بیمار (دقت ارجاع) برای ۱۴۴۹ ضایعه و ۲۷۰ مورد «مثبت» انجام شد.
مطالعات از نظر نوع افراد مبتلا به ضایعات مشکوک سرطان پوست وارد شده و نوع استفاده از تلهدرماتولوژی با یکدیگر متفاوت بودند. یک تخمین معتبر واحد از دقت تلهدرماتولوژی انجام نشد. برای تشخیص درست یک ضایعه به عنوان سرطان پوست، دادهها نشان دادند که کمتر از ۷% از ضایعات پوستی بدخیم توسط تلهدرماتولوژی از دست رفتند. نتایج مطالعه متغیرتر از آن بودند که به ما بگویند چه تعداد از افراد به صورت غیر‐ضروری پس از یک مشاوره تلهدرماتولوژی، به ملاقات با یک متخصص درماتولوژی ارجاع داده شدند. با این حال، بدون دسترسی به خدمات تلهدرماتولوژی، اکثر ضایعات وارد شده در این مطالعات احتمالا به یک درماتولوژیست ارجاع داده خواهند شد.
نتایج مطالعات این مرور چقدر قابل اعتماد هستند؟
در مطالعات وارد شده، تشخیص نهایی سرطان پوست از طریق بیوپسی ضایعه انجام شد (نمونهبرداری کوچک از ضایعه بهطوری که بتوان آن را زیر یک میکروسکوپ بررسی کرد) و عدم وجود سرطان پوست از طریق بیوپسی یا پیگیری در طول زمان تایید شد تا اطمینان حاصل شود که ضایعه پوستی از نظر ملانوم منفی باقی مانده است. این احتمالا یک روش قابل اعتماد برای تصمیمگیری درباره این موضوع است که افراد واقعا سرطان پوست دارند یا خیر. در چند مطالعه، تشخیص عدم وجود سرطان پوست به جای بیوپسی توسط متخصص پوست انجام شد. احتمال کمتری وجود دارد که این یک روش قابل اعتماد برای تصمیمگیری درباره این موضوع باشد که افراد واقعا سرطان پوست داشتند یا خیر*. گزارشدهی ضعیف از آنچه که در این مطالعه انجام شد بیان اینکه نتایج این مطالعه چقدر قابل اعتماد است را دشوار کرد. ورود تعدادی از بیماران از کلینیکهای تخصصی به جای مراکز مراقبتهای اولیه همراه با راههای مختلف انجام تلهدرماتولوژی مشکلات شایعی بود.
نتایج این مرور برای چه کسانی کاربرد دارد؟
مطالعات در: اروپا (۶۴%)، آمریکای شمالی (۱۸%)، آمریکای جنوبی (۹%) یا اقیانوسیه (۹%) انجام شدند. میانگین سن افراد مورد مطالعه ۵۲ سال بود؛ با این حال، چندین مطالعه حداقل افراد زیر ۱۶ سال را وارد کردند. درصد افراد مبتلا به سرطان پوست بین ۲% تا ۸۸% با میانگین ۳۰% بود، که بسیار بیشتر از آنچه که در مراکز مراقبتهای اولیه مشاهده شد، بوده است.
کاربردهای این مرور چه هستند؟
تلهدرماتولوژی احتمالا راه خوبی برای کمک به GPها است تا تصمیم بگیرند که کدام ضایعات پوستی باید توسط متخصص پوست رویت شوند. مرور ما نشان میدهد که استفاده از تصاویر بزرگ، علاوه بر عکسهای ضایعه، دقت را بهبود میبخشد. برای ایجاد بهترین روش ارائه خدمات تلهدرماتولوژی پژوهش بیشتری مورد نیاز است.
این مرور تا چه زمانی بهروز است؟
نویسندگان مرور به جستوجو و استفاده از مطالعاتی پرداختند که تا آگوست ۲۰۱۶ منتشر شدند.
*در این مطالعات، بیوپسی، پیگیری بالینی یا تشخیص پزشکان متخصص، جزو مقایسههای مرجع بودند.
این مرور ۱۰ مطالعه گزارش دهنده را از ۱۱ مطالعه کوهورت وارد کرد. تمام ۱۱ مطالعه کوهورت دادههای مربوط به تشخیص BCC را، از جمله ۲۰۳۷ ضایعه (۴۶۴ مورد با BCC)؛ و چهار مطالعه کوهورت دادههای مربوط به تشخیص cSCC را، از جمله ۸۳۴ ضایعه (۷۱ مورد با cSCC) گزارش کردند. فقط یک مطالعه دادههای مربوط به تشخیص BCC یا cSCC را با استفاده از درموسکوپی و مقایسههای محدود بین RCM و درموسکوپی نیز گزارش کرد. مطالعات تقریبا در تمام حوزههای کیفیت روششناسی در معرض خطر بالا یا نامشخص سوگیری (bias) قرار داشتند و در رابطه با قابلیت کاربرد شواهد، نگرانیهای بالا یا نامشخصی وجود داشت. به کارگیری انتخابی شرکتکنندگان، کورسازی نامشخص تست مرجع و حذف شدن به دلیل کیفیت تصویر یا مشکلات فنی مشاهده شد. مشخص نبود که مطالعات نشان دهنده جمعیت واجد شرایط برای تست با RCM بودند یا خیر، و تفسیر تست اغلب با استفاده از تصاویر، کنترل از راه دور شرکتکننده و کورسازی تفسیر کننده نسبت به اطلاعات بالینی که معمولا در عمل در دسترس هستند انجام شد.
متاآنالیز نشان داد که RCM حساستر است اما برای تشخیص BCC در مطالعات مربوط به شرکتکنندگان با ضایعات مشکوک (حساسیت: ۹۴%؛ ۹۵% فاصله اطمینان (CI): ۷۹% تا ۹۸%؛ ویژگی: ۸۵%؛ ۹۵% CI؛ ۷۲% تا ۹۲%؛ ۳ مطالعه) در مقایسه با مطالعاتی که هر نوع ضایعه مشکوک را وارد کردند (حساسیت: ۷۶%؛ ۹۵% CI؛ ۴۵% تا ۹۲%؛ ویژگی: ۹۵%؛ ۹۵% CI؛ ۶۶% تا ۹۹%؛ ۴ مطالعه) دارای ویژگی کمتر است، هر چند CIها گسترده بودند. در میانه ۱۲,۵% شیوع بیماری در مطالعات مربوط به هر نوع ضایعه مشکوک، اعمال این نتایج در یک جمعیت فرضی منجر به مشاهده نتایج ۳۰ مورد BCC از دست رفته با ۴۴ نتیجه مثبت کاذب در ۱۰۰۰ ضایعه شد (ضایعات اشتباه تشخیص داده شده به عنوان BCCها). در میانه ۱۵% شیوع بیماری در مطالعات مربوط به ضایعات دو‐پهلو، در یک جمعیت فرضی با ۱۰۰۰ ضایعه، نه مورد BCC با ۱۲۸ نتیجه مثبت کاذب از دست خواهد رفت. در هر دو مجموعه مطالعات، تا ۱۵% از ضایعات مثبت کاذبی که به اشتباه BCC در نظر گرفته شدند، ملانوم بودند. پیشنهاداتی برای حساسیت بیشتر در مطالعات دارای تفسیر کنندگان باتجربهتر وجود داشت. به دلیل کمبود داده، حساسیت و ویژگی خلاصه برای تشخیص cSCC قابل تخمین نبود.
هدف از انجام این مرور چیست؟
هدف از این مرور کاکرین این بود که بدانیم میکروسکوپ کانفوکال بازتابی (reflectance confocal microscopy; RCM) به تنهایی یا در مقایسه با بررسی ضایعه پوستی با چشم غیر‐مسلح به تنهایی یا با استفاده از یک میکروسکوپ دستی به نام درموسکوپی برای تشخیص دو شکل شایع سرطان کراتینوسیت پوست: کارسینوم سلول بازال (basal cell carcinoma; BCC) یا کارسینوم سلول سنگفرشی پوستی (cutaneous squamous cell carcinoma; cSCC) در بزرگسالان، چقدر دقیق است. نویسندگان مرور در کاکرین ۱۰ مطالعه را برای پاسخ به این سوال وارد کردند.
چرا بهبود تشخیص BCC یا cSCC مهم است؟
چندین نوع مختلف سرطان پوست وجود دارد. BCC و cSCC بهطور کلی سرطانهای موضعی پوست هستند. تشخیص صحیح مهم است زیرا تشخیص اشتباه یک نوع سرطان پوست به جای نوع دیگر میتواند منجر به درمان اشتباه یا تاخیر در درمان موثر شود. از دست رفتن تشخیص BCC (که به عنوان یک نتیجه منفی کاذب شناخته میشود) میتواند منجر به از دست رفتن BCC در حال رشد و بدشکلی شود. تشخیص نامناسب cSCC جدیتر است زیرا میتواند به سایر قسمتهای بدن گسترش یابد. تشخیص سرطان پوست زمانی که واقعا وجود نداشته باشد (نتیجه مثبت کاذب) ممکن است منجر به بیوپسی یا درمان غیر‐ضروری و موجب ناراحتی و نگرانی بیماران شود.
در این مرور چه موضوعی بررسی شد؟
تکنیکهای میکروسکوپیک توسط متخصصان سرطان پوست مورد استفاده قرار میگیرند تا بتوانند معاینه جزئیتر، و دقیقتری از ضایعات مشکوک پوست، که میتوان با استفاده از چشم غیر‐مسلح به تنهایی به دست آورد، ارائه دهند. در حال حاضر درموسکوپی (dermoscopy) توسط پزشکان به عنوان بخشی از بررسی ضایعات مشکوک پوست استفاده میشود. RCM یک روش میکروسکوپیک جدید برای افزایش بزرگنمایی است. این یک دستگاه دستی یا یونیت استاتیک است که با استفاده از نور مادون قرمز کار میکند و میتواند در مقایسه با درموسکوپی، لایههای عمیقتر پوست را نمایش دهد. هر دو تکنیک پروسیجرهای بدون درد هستند، اما RCM گرانتر و وقتگیر بوده و نیازمند آموزش تخصصی بیشتری است. درموسکوپی میتواند توسط پزشکان عمومی (general practitioners; GP) مورد استفاده قرار گیرد در حالی که RCM احتمالا فقط توسط متخصصان بیمارستان برای افرادی استفاده میشود که با یک ضایعه پوستی که مشکوک به سرطان پوست است ارجاع داده شدهاند. ما میخواستیم بدانیم که RCM باید به جای، یا همانند، بررسی ضایعه پوست با استفاده از چشم غیر‐مسلح به تنهایی یا با استفاده از درموسکوپی برای تشخیص BCC یا cSCC استفاده شود. دقت این تست هنگام استفاده در افراد مبتلا به هر گونه ضایعه مشکوک پوست و همچنین در افراد مبتلا به ضایعات پوستی که تشخیص آن مشکل بود، مورد بررسی قرار گرفت.
نتایج اصلی این مرور چه هستند؟
ما ۱۰ مطالعه را یافتیم که شامل اطلاعات مربوط به ۱۱ گروه از افراد مبتلا به ضایعات مشکوک به سرطان پوست بودند. نتایج اصلی بر اساس هفت مورد از ۱۱ مجموعه دادهای بود: چهار مورد مربوط به هر گونه ضایعه مشکوک به سرطان پوست و سه مورد در رابطه با ضایعات پوستی که تشخیص آنها بسیار دشوار بود.
برای مقایسه RCM در برابر درموسکوپی، ما چهار مجموعه دادهای یافتیم که حاوی ۹۱۲ ضایعه پوستی مشکوک بودند. این نتایج نشان دادند که در یک گروه ۱۰۰۰ نفری مبتلا به ضایعه مشکوک، که ۱۲۵ نفر (۱۲,۵%) واقعا BCC دارند:
‐ تخمین زده شده که ۱۳۹ نفر نتیجه RCM خواهند داشت و این نشان دهنده وجود BCC است؛
‐ از این تعداد، ۴۴ نفر (۳۲%) افراد BCC نخواهند داشت (نتایج مثبت کاذب)، شامل یک فرد مبتلا به ملانوم که به اشتباه برای BCC در نظر گرفته شده بود؛
‐ از ۸۶۱ نفر با نتیجه RCM که نشان دهنده این است BCC وجود ندارد، ۳۰ نفر (۳%) در واقع BCC خواهند داشت.
این مرور همچنین شامل سه مجموعه دادهای در مورد افرادی بود که ۶۶۸ مورد بسیار دشوار برای تشخیص ضایعات پوستی بودند، یک مجموعه مربوط به مقایسه RCM با درموسکوپی بود. این نتایج نشان دادند که اگر RCM توسط متخصصان پوست در یک گروه ۱۰۰۰ نفری مورد استفاده قرار گیرد، ۱۵۰ نفر (۱۵%) واقعا BCC دارند:
‐ تخمین زده شده که ۲۶۹ نفر نتیجه RCM خواهد داشت و این نشان دهنده وجود BCC است؛
‐ از این تعداد، ۱۲۸ (۴۸%) افراد BCC نخواهند داشت (که به عنوان یک نتیجه مثبت کاذب شناخته میشود)، شامل ۱۹ نفر مبتلا به ملانوم که به اشتباه BCC تشخیص داده شدند؛
‐ ۷۳۲ نفر با نتیجه RCM نشان دهنده عدم وجود BCC است، نه مورد (۱%) در واقع BCC دارند.
شواهد کافی برای تعیین دقت RCM در تشخیص cSCC در هر گروه جمعیت وجود نداشت.
نتایج این مرور چقدر قابل اعتماد هستند؟
اختلافات زیادی در نتایج مطالعات این مرور وجود داشت. گزارشدهی ضعیف مطالعه انجام شده، ارزیابی قابلیت اطمینان مطالعات را دشوار ساخت. مشخص نبود که مطالعات شامل جمعیتی واجد شرایط برای تست RCM بودند یا خیر و تفسیر تست اغلب با استفاده از تصاویر، کنترل از راه دور بیمار و کورسازی تفسیر کننده نسبت به اطلاعات بالینی که معمولا در عمل در دسترس هستند، انجام شده یا خیر. فقط یک مطالعه دقت درموسکوپی و RCM را مقایسه کرد. اکثر مطالعات توسط تیمهای پژوهشی متخصص با سطح بالایی از آموزش و تجربه درباره RCM انجام شدند، به این معنی که RCM ممکن است بهتر از آن باشد که در عمل روزانه استفاده میشود. اکثر مطالعات تشخیص را بر اساس مشاهدات ذهنی ناظران گزارش کردند، که ممکن است برای افرادی که از این تکنیک در عمل روزانه استفاده میکنند، یکسان نباشد. در نه مطالعه، تشخیص سرطان پوست بر اساس بیوپسی پوست یا با پیگیری این افرادی در طول زمان انجام شد تا اطمینان حاصل شود که آنها از نظر سرطان پوست منفی هستند*. این احتمالا برای تصمیمگیری درباره اینکه بیماران واقعا سرطان پوست داشتند، یک روش قابل اعتماد بوده است. در یک مطالعه، فقدان سرطان پوست توسط کارشناسانی انجام گرفت که به بررسی پوست پرداختند، روشی که ممکن است برای تصمیمگیری در مورد اینکه بیماران واقعا سرطان پوست داشتند، کمتر قابل اعتماد باشد.
نتایج این مرور برای چه کسانی کاربرد دارد؟
پنج مطالعه در اروپا (۶۱%)، و بقیه در آسیا، اقیانوسیه، آمریکای شمالی، یا در بیش از یک قاره انجام شدند. میانگین سنی افراد به کار گرفته شده از ۴۱ تا ۶۵ سال متغیر بود. درصد افراد مبتلا به BCC در این مطالعات از ۶% تا ۸۳% متغیر بود (مقدار متوسط ۱۲% برای هر نوع ضایعه مشکوک و ۱۵% برای تشخیص دشوار ضایعات پوستی). برای مطالعات مربوط به RCM استفاده شده برای cSCC، درصد افراد مبتلا به cSCC بین ۴% تا ۱۳% متغیر بود. در بسیاری از مطالعات مشخص نبود که افراد مشارکت کننده پیش از RCM چه تستی دریافت کردند.
کاربردهای این مرور چه هستند؟
برای حمایت از استفاده از RCM برای تشخیص BCC یا cSCC در خارج از مطالعات پژوهشی شواهد چندان خوبی وجود نداشت. درباره نتایج و در نحوه انجام مطالعات، کاهش قابلیت اطمینان یافتهها، اختلافات و عدم قطعیت زیادی وجود داشت. با استفاده از RCM ممکن است نیاز به بیوپسی تشخیصی در افرادی که نظر پزشک درباره ضایعه BCC با شبهه زیادی همراه است، وجود نداشته باشد، اما برای تایید این امر پژوهش بیشتری مورد نیاز است. چنین پژوهشی باید در گروههایی از افراد مبتلا به ضایعات مشکوک پوست که به خوبی توصیف شدهاند، RCM را با درموسکوپی مقایسه کنند و باید بگویند که سایر سرطانهای پوستی در نهایت تشخیص داده نمیشوند یا به اشتباه به عنوان BCC طبقهبندی میشوند.
این مرور تا چه زمانی بهروز است؟
نویسندگان مرور به جستوجو و استفاده از مطالعاتی پرداختند که تا آگوست ۲۰۱۶ منتشر شدند.
* در این مطالعات، بیوپسی، یا پیگیری بالینی استاندارد مرجع (ابزار تایید تشخیص نهایی) بودند.
۲۴ مقاله منتشر شده را وارد کردیم که درباره ۲۴ مطالعه کوهورت گزارش دادند، که ۲۷ مجموعه داده در مورد معاینه بصری (۸۸۰۵ ضایعه؛ ۲۵۷۹ مورد بدخیم) و ۳۳ مجموعه داده در مورد درموسکوپی (۶۸۵۵ ضایعه؛ ۱۴۴۴ مورد بدخیم) را ارائه کردند. خطر سوگیری (bias) برای تست شاخص (برای ارزیابی درموسکوپی) و حوزههای استاندارد مرجع، به ویژه برای ارزیابیهای شخصی عمدتا پائین و برای ورود شرکتکنندگان، استفاده از تست شاخص برای معاینه بصری و برای جریان و زمانبندی شرکتکنندگان بالا یا نامشخص بود. نگرانیهای مربوط به قابلیت کاربرد یافتههای مطالعه را تقریبا در تمام حوزههای تمام مطالعات «بالا» یا «نامشخص» رتبهبندی کردیم. به کارگیری انتخابی شرکتکنندگان، عدم قابلیت تکرارپذیری آستانههای تشخیص و فقدان جزئیات در مورد تخصص تفسیر کننده، به ویژه مشکلساز بود.
تشخیص BCC در ۲۸ مجموعه داده گزارش شد: ۱۵ مورد توسط شخص و ۱۳ مورد مبتنی بر تصویر. تجزیهوتحلیل مطالعات بر اساس تست قبلی شرکتکنندگان و با توجه به تخصص تفسیر کننده به دلیل کمبود داده امکانپذیر نبود. مطالعات عمدتا درباره شرکتکنندگانی انجام شد که برای ارزیابی تخصصی ضایعات با طبقهبندی هیستولوژیک موجود ارجاع داده شدند. هیچ تفاوت روشنی را از نظر دقت بین مطالعات درموسکوپی انجام شده توسط شخص و مطالعاتی که تصاویر را ارزیابی کردند، نیافتیم. فقدان تاثیر مشاهده شده ممکن است ناشی از منابع دیگر ناهمگونی باشد، از جمله تفاوت در انواع ضایعات پوستی مورد مطالعه، در درماتوسکوپهای مورد استفاده، یا در استفاده از الگوریتمها و آستانههای مختلف برای تصمیمگیری در مورد نتیجه مثبت تست.
متاآنالیز در ارزیابی شخص از درموسکوپی (۷ ارزیابی؛ ۴۶۸۳ ضایعه و ۳۶۳ مورد BCC) برای تشخیص BCC، نسبت به معاینه بصری بهتنهایی (۸ ارزیابی؛ ۷۰۱۷ ضایعه و ۱۵۸۶ مورد BCC)، با نسبت شانس تشخیصی نسبی (RDOR) برابر با ۸,۲ (۹۵% فاصله اطمینان (CI): ۳.۵ تا ۱۹.۳؛ ۰.۰۰۱ > P) دقت بیشتری یافت. این دقت با تفاوتهای پیشبینی شده در حساسیت ۱۴%؛ (۹۳% در برابر ۷۹%) با ویژگی ثابت ۸۰% و تفاوتهای پیشبینی شده در ویژگی ۲۲%؛ (۹۹% در برابر ۷۷%) با حساسیت ثابت ۸۰% مطابقت دارد. نتایج بسیار مشابهی را برای ارزیابی مبتنی بر تصویر مشاهده کردیم.
هنگامی که در یک جمعیت فرضی با ۱۰۰۰ ضایعه، که ۱۷۰ مورد BCC هستند، اعمال شد (بر اساس میانگین شیوع BCC در سراسر مطالعات)، حساسیت افزایش یافته ۱۴% به دست آمده از درموسکوپی، با فرض ۱۶۶ نتیجه مثبت کاذب از هر دو تست، موجب کاهش ۲۴ مورد BCC از دست رفته شد. %۲۲ افزایش در ویژگی به دست آمده از درموسکوپی با حساسیتی که در ۸۰% ثابت شد، باعث کاهش ۱۸۳ مورد اکسیزیون غیر‐ضروری، با فرض ۳۴ مورد BCC از دست رفته در هر دو تست شد. شواهد کافی برای ارزیابی استفاده از الگوریتمها یا چکلیستهای ساختاری برای معاینه بصری یا درموسکوپی وجود نداشت.
دادههای کافی برای نتیجهگیری در مورد دقت هر دو تست برای تشخیص cSCCها در دسترس نبود.
هدف از انجام این مرور چیست؟
ما میخواستیم بدانیم که استفاده از یک میکروسکوپ تابشی دستی (درموسکوپ یا «درموسکوپی») در تشخیص کارسینوم سلول بازال (basal cell carcinoma; BCC) یا کارسینوم سلولهای سنگفرشی پوستی (cutaneous squamous cell carcinoma; cSCC) در مقایسه با فقط نگاه کردن به پوست با چشم غیر‐مسلح بهتر است. ۲۴ مطالعه را برای پاسخ به این سوال وارد کردیم.
چرا بهبود تشخیص BCC یا cSCC مهم است؟
چندین نوع سرطان مختلف پوست وجود دارد. BCC و cSCC نسبت به سرطان ملانوم پوست کمتر جدی هستند، زیرا معمولا به آرامی رشد میکنند و BCC به سایر اندامهای بدن گسترش نمییابد. تشخیص درست BCC یا cSCC هنوز مهم است، زیرا درمان آنها ممکن است متفاوت باشد. یک BCC تشخیص داده نشده (که تحت عنوان نتیجه منفی کاذب شناخته میشود) میتواند منجر به نابودی و نیاز به جراحی بزرگتری شود. یک cSCC از دسترفته میتواند به سایر قسمتهای بدن گسترش یابد. تشخیص BCC یا cSCC زمانی که آنها در واقع وجود نداشته باشند (نتیجه مثبت کاذب) ممکن است به معنای درمان غیر‐ضروری باشد، برای مثال برداشتن از طریق جراحی ممکن است باعث یک اسکار ناخوشایند و ایجاد نگرانی در بیماران شود در صورتی که ضایعه (یک خال یا ناحیهای از پوست با ظاهر غیر‐معمول در مقایسه با پوست اطراف) خوشخیم است (نه یک سرطان)، یا ممکن است منجر به درمان اشتباه شود، به عنوان مثال یک درمان غیر‐جراحی، که در صورت تشخیص اشتباه ضایعه مورد استفاده قرار میگیرد.
در این مرور چه موضوعی بررسی شد؟
یک درماتوسکوپ یک ذرهبین دستی است که دارای منبع نوری است. درموسکوپی اغلب توسط متخصصان پوست برای کمک به تشخیص سرطان پوست استفاده میشود. این درمان بیشتر توسط پزشکان عمومی نیز استفاده میشود.
علاوه بر اینکه میخواستیم بدانیم این مداخله بهطور کلی چیزی به معاینه بصری به تنهایی اضافه میکند، همچنین میخواستیم بدانیم که دقت درموسکوپی در صورت استفاده از مشاوره رو‐در‐رو یا استفاده از تصاویری از ضایعات پوستی که برای متخصصان فرستاده میشود، متفاوت است. همچنین سعی کردیم بدانیم که دقت درموسکوپی با استفاده از یک چکلیست بهبود مییابد، یا هنگام استفاده توسط یک متخصص پوست در مقایسه با غیر‐متخصص بهتر است.
نتایج اصلی این مرور چه هستند؟
این مرور شامل ۲۴ مطالعه گزارش دهنده اطلاعات مربوط به افراد مبتلا به ضایعات مشکوک به سرطان پوست است.
تشخیص BCC با حضور بیمار
۱۱ مطالعه مرتبط را یافتیم. هشت مطالعه (از جمله ۷۰۱۷ ضایعه پوستی مشکوک) دقت معاینه بصری را توسط خودشان بررسی کردند و هفت مطالعه (با ۴۶۸۳ ضایعه پوستی مشکوک) دقت درموسکوپی اضافه شده را به معاینه بصری بررسی کردند (چهار مورد از آنها دادههای مربوط به معاینه بصری توسط خود و درماتوسکوپی اضافه شده به معاینه بصری را گزارش کردند). نتایج نشان میدهند که درموسکوپی، هم برای شناسایی درست BCC و هم برای برداشتن ضایعاتی که BCC نیستند، دقیقتر از معاینه بصری توسط خود است.
نتایج به دست آمده میتوانند با استفاده از یک گروه دارای ۱۰۰۰ ضایعه، که ۱۷۰ مورد BCC هستند (۱۷%)، نشان داده شوند. برای اینکه ببینیم درموسکوپی در شناسایی درست BCC در مقایسه با فقط نگاه کردن به پوست چقدر بهتر است، باید فرض کنیم که هر دو منجر به همان تعداد ضایعاتی میشوند که به اشتباه BCC تشخیص داده شدند (ما فرض کردیم که ۱۶۶ مورد از ۸۳۰ ضایعه بدون BCC تشخیص نادرست BCC داشتند). در این وضعیت ثابت، اضافه کردن درموسکوپی به معاینه بصری ۲۴ مورد اضافی (۱۵۸ در مقایسه با ۱۳۴) را که فقط با نگاه کردن به پوست به تنهایی از دست رفتند، به درستی تحت عنوان BCC شناسایی خواهد کرد. به عبارت دیگر، سرطانهای BCC بیشتری به درستی شناسایی میشوند.
برای اینکه ببینیم درموسکوپی در تصمیمگیری در مورد اینکه یک ضایعه پوستی BCC نیست در مقایسه با فقط نگاه کردن به پوست چقدر بهتر است، باید فرض کنیم که هر دو منجر به همان تعداد BCCهایی میشوند که به درستی تشخیص داده شدند (در این مورد فرض میکنیم که ۱۳۶ مورد از ۱۷۰ مورد BCC به درستی تشخیص داده میشوند). در این وضعیت، اضافه کردن درموسکوپی به معاینه بصری تعداد ضایعاتی را که به اشتباه BCC تشخیص داده شدند ۱۸۳ مورد کاهش داد (کاهش از ۱۹۱ نفر در گروه معاینه بصری به هشت نفر در گروه درموسکوپی). به عبارت دیگر، ضایعات بیشتری که BCC نبودند، به درستی شناسایی شده و افراد کمتری در پایان برای جراحی فرستاده میشوند.
تشخیص BCC مبتنی بر تصویر
یازده مطالعه در مورد تشخیص BCC با استفاده از عکسهای بالینی یا تصاویر بزرگ شده به دست آمده از یک درماتوسکوپ وارد شدند. چهار مطالعه، (شامل ۸۵۳ مورد ضایعه پوستی مشکوک) از معاینه بصری عکسها و نه مطالعه (شامل ۲۲۷۱ ضایعه مشکوک) از تصاویر درموسکوپیک استفاده کردند (دو مطالعه دادههای مربوط به تشخیص را با استفاده از عکسها و استفاده از تصاویر درموسکوپیک گزارش کردند). نتایج بسیار مشابه مطالعات شخصی بود.
مقدار چکلیستها و تخصصهای تفسیر کنندهها
هیچ شواهدی وجود نداشت که نشان دهد استفاده از چکلیست برای کمک به تفسیر معاینه بصری یا درموسکوپی دقت تشخیصی را بهبود میبخشد. شواهد کافی برای بررسی تاثیر تخصص بالینی و آموزش وجود نداشت.
تشخیص cSCC
شواهد کافی که برای تایید دقت هر دو تست در تشخیص cSCCها قابل اعتماد باشند وجود نداشت.
نتایج مطالعات این مرور چقدر قابل اعتماد است؟
اکثر مطالعات ما تشخیص نهایی قابل اعتمادی را با بیوپسی ضایعه ارائه کرده و با پیگیری افراد در طول زمان از منفی باقی ماندن ضایعه پوست از نظر سرطان پوست مطمئن میشوند. برخی از مطالعات از تشخیص متخصص برای تایید عدم وجود سرطان پوست استفاده میکنند، که کمتر قابل اعتماد است*. گزارشدهی ضعیف از آنچه که در مطالعات انجام شده بود، قضاوت را در مورد اینکه این مطالعات چقدر قابل اعتماد بودند برای ما دشوار کرد. بعضی از مطالعات انواع خاصی را از ضایعات پوستی از مطالعه حذف کردند و بعضی از آنها این موضوع را که چگونه نتیجه تست مثبت را برای ارجاع هدفمند به یک متخصص یا درمان توصیف شدند تشریح نکردند.
نتایج این مرور برای چه کسانی کاربرد دارد؟
یازده مطالعه در اروپا (۴۶%)، و بقیه در آمریکای شمالی (n = ۳)، آسیا (n = ۵)، اقیانوسیه (n = ۲)، یا چندین کشور (n = ۳) انجام شد. افرادی که در این مطالعات وارد شدند بین ۳۰ تا ۷۴ سال بودند. درصد افراد مبتلا به BCC بین ۱% تا ۶۱% برای مطالعات شخصی و بین ۲% تا ۶۳% در مطالعات استفاده کننده از تصاویر متغیر بود. تقریبا تمام مطالعات درباره افرادی انجام شد که از مرکز مراقبتهای اولیه به درمانگاههای تخصصی پوستی ارجاع داده شدند. بیش از نیمی از مطالعات توانایی درموسکوپی و معاینه بصری را برای تشخیص هر نوع سرطان پوست، از جمله ملانوم و BCC در نظر گرفتند، در حالی که ۱۰ مطالعه (۴۲%) فقط روی BCC متمرکز بودند. تغییر در تخصص پزشکان انجام دهنده معاینات و تفاوت در تعاریف مورد استفاده برای تصمیمگیری هنگام مثبت بودن یک تست، نحوه انجام درموسکوپی را و اینکه چه سطحی از آموزش برای دستیابی به دقت مشاهده شده در مطالعات مورد نیاز است، مشخص نمیکرد.
کاربردهای این مرور چه هستند؟
هنگامی که درموسکوپی توسط متخصصین مورد استفاده قرار میگیرد، ابزار مفیدی برای کمک به تشخیص درست BCC در مقایسه با معاینه بصری بهتنهایی است. مشخص نیست که درموسکوپی باید توسط پزشکان عمومی مورد استفاده قرار گیرد تا افراد مبتلا به ضایعات مشکوک را که نیاز به ویزیت یک متخصص دارند، به درستی شناسایی کند. به نظر میرسد که چکلیستها برای کمک به تفسیر درموسکوپی به بهبود دقت تشخیص BCC کمک نمیکند. پژوهش بیشتری لازم است تا بدانیم که درموسکوپی در مراکز مراقبتهای اولیه مفید است یا خیر.
این مرور تا چه زمانی بهروز است؟
نویسندگان این مرور به دنبال یافتن و استفاده از مطالعاتی بودند که تا آگوست ۲۰۱۶ منتشر شدند.
* در این مطالعات بیوپسی، پیگیری بالینی یا تشخیص پزشکان متخصص، استانداردهای مرجع بود (ابزار تایید تشخیص نهایی).
ما پنج مطالعه را با ۵۲۹ ضایعه پوستی (۲۸۲ ضایعه بدخیم) وارد کردیم که نه مجموعه دادهای را برای OCT، دو مجموعه دادهای را برای معاینه بصری بهتنهایی و دو مجموعه دادهای را برای معاینه بصری به همراه درموسکوپی ارائه کردند. کیفیت مطالعات با استفاده از آستانههای دادهای ارائه شده برای مثبت بودن تست و ارائه گزارشهای ضعیف از تفسیر استاندارد مرجع و کورسازی متوسط تا نامشخص بود. مطالعات ممکن است نماینده جمعیت مناسب برای OCT در عمل نباشند، به عنوان مثال به علت شیوع بالای بیماری در جمعیت مطالعه، ممکن است چگونگی استفاده از OCT را در بالین منعکس نکنند، برای مثال با استفاده از تصاویر مورد نیاز قبلی OCT.
امکان ارائه گزارش خلاصه در مورد دقت تشخیص ملانوم یا cSCC به دلیل کمبود مطالعات، حجم کوچک نمونهها و به دلیل تفاوتهای ملانوم در تکنولوژیهای OCT استفاده شده (کیفیت بالای OCT در مقابل رزولوشن متعارف) و تفاوت در درجه تستهای انجام شده قبلی OCT (یعنی معاینه بصری بهتنهایی یا معاینه بصری به همراه درموسکوپی) وجود نداشت.
دادههای تلفیقی به دست آمده از دو مطالعه با استفاده از OCT متعارف swept‐source در کنار معاینه بصری و درموسکوپی برای تشخیص BCC، حساسیت OCT با ۹۵% (۹۵% فاصله اطمینان (CI)؛ ۹۱% تا ۹۷%) و ویژگی ۷۷% (۹۵% CI؛ ۶۹% تا ۸۳%) را برآورد کردند.
هنگامی که این روش در یک جمعیت فرضی با ۱۰۰۰ ضایعه، با ۶۰% میانگین شیوع BCC مشاهده شده اعمال شد، OCT منجر به از دست رفتن ۳۱ مورد BCC (کمتر از ۹۱ مورد با استفاده از معاینه بصری بهتنهایی و کمتر از ۵۳ مورد با استفاده از معاینه بصری به همراه درموسکوپی از دست خواهد رفت) و ۹۳ مورد نتیجه مثبت‐کاذب برای BCC (کاهش ۱۵۹ مورد برداشتن غیر‐ضروری در مقایسه با استفاده از معاینه بصری بهتنهایی و ۸۷ مورد در مقایسه با معاینه بصری به همراه درموسکوپی) شد.
دادههای کافی در مورد استفاده از OCT برای تشخیص ملانوم یا cSCC در دسترس نیستند. دادههای اولیه نشان میدهند کهOCT متعارف ممکن است در تشخیص BCC در ضایعات بالینی چالشبرانگیز نقش داشته باشد، در حالی که متاآنالیز ما حساسیت بالاتر و ویژگی بالاتری را در مقایسه با معاینه بصری به همراه درموسکوپی نشان میدهد. با این حال، تعداد اندک مطالعات و کیفیت متغیر روششناسی به این معنی است که در حال حاضر نمیتوان به این نتیجه رسید که این کاربردها برای هدایت عمل بالینی ایجاد شدهاند.
با توجه به کمبود دادهها در مورد مقایسه OCT با درموسکوپی و سایر اهداف تشخیصی مشابه مانند میکروسکوپ کانفوکال بازتابی، انجام مطالعات تطبیقی احتمالی که به صورت مناسبی طراحی شوند، مورد نیاز هستند.
چرا بهبود تشخیص سرطان پوست مهم است؟
چندین نوع سرطان پوست مختلف وجود دارد. ملانوم یکی از خطرناکترین انواع سرطان است، و مهم است که زود تشخیص داده شود تا بتوان آن را برداشت. اگر این وضعیت تشخیص داده نشود (تحت عنوان نتیجه منفی‐کاذب تست نیز شناخته میشود)، درمان ممکن است به تعویق افتد، و این خطر که ملانوم به اندامهای دیگر بدن گسترش یابد، ممکن است منجر به مرگ ناگهانی بیمار شود. کارسینوم سلول سنگفرشی پوستی (cutaneous squamous cell carcinoma; cSCC) و کارسینوم سلول بازال (basal cell carcinoma; BCC) معمولا جزو سرطانهای موضعی پوست هستند (یعنی محدود به بخش خاصی از بدن)، اگرچه cSCC میتواند به سایر قسمتهای بدن گسترش یابد و BCC اگر زود تشخیص داده نشود، ممکن است منجر به بد‐شکلی شود. تشخیص سرطان پوست زمانی که واقعا وجود نداشته باشد (نتیجه مثبت‐کاذب) ممکن است منجر به انجام جراحی غیر‐ضروری و سایر بررسیها شده و باعث ایجاد استرس و اضطراب در بیمار شود. تشخیص صحیح مهم است و تشخیص اشتباه یک نوع سرطان پوست به جای نوع دیگر میتواند منجر به درمان اشتباه یا تأخیر در درمان موثر شود.
هدف این مرور چیست؟
هدف از این مرور کاکرین این بود که بدانیم توموگرافی انسجام نوری (optical coherence tomography; OCT) برای تشخیص سرطان پوست چقدر دقیق است. محققان در کاکرین پنج مطالعه را برای پاسخ به این سوال وارد کردند. دو مطالعه در رابطه با تشخیص ملانوم و سه مطالعه در رابطه با تشخیص BCC بود.
چه چیزی در این مرور مورد بررسی قرار گرفت؟
چندین ابزار برای متخصصان سرطان پوست وجود دارد که اجازه میدهد بررسی دقیقتری را از پوست در مقایسه با بررسی با چشم غیر‐مسلح انجام دهند. در حال حاضر، درموسکوپ (dermoscope) توسط اغلب متخصصین سرطان پوست استفاده میشود، که با استفاده از یک منبع نور روشن، ضایعه پوست (یک خال یا یک ناحیه از پوست با ظاهر غیر‐طبیعی در مقایسه با پوست اطراف آن) را بزرگتر نشان میدهد. OCT سطح ضایعه پوست را بزرگتر نشان میدهد تا با استفاده از میکروسکوپ و نور نزدیک‐مادون قرمز دیده شود. این عمل سریع انجام میشود اما در مقایسه با درموسکوپی گرانتر است و نیاز به آموزش تخصصی دارد. نویسندگان مرور این موضوع را بررسی کردند که OCT برای کمک به تشخیص سرطان پوست هنگام استفاده پس از معاینه بصری یا معاینه بصری به همراه درموسکوپی چقدر مفید است.
نتایج اصلی این مرور چه هستند؟
این مرور شامل پنج مطالعه بود: دو مطالعه با ۹۷ شرکتکننده با ۱۳۳ ضایعه پوستی مشکوک به ملانوم، و سه مطالعه با ۳۰۵ شرکتکننده با ۳۹۶ ضایعه مشکوک به BCC که یکی از آنها (۵۰ ضایعه) cSCCs (نه ضایعه) را نیز بررسی کرد.
مطالعات ارزیابی کننده دقت OCT برای تشخیص ملانوم کوچک و بسیار متفاوت از یکدیگر بودند در نتیجه امکان برآورد قابل اطمینانی را از دقت OCT برای ملانوم فراهم نمیکنند. به همین ترتیب، فقط یک مطالعه کوچک و با کیفیت پائین دقت OCT را برای تشخیص cSCC مورد بررسی قرار داد.
برای شناسایی BCC، دو مطالعه اثرات استفاده متخصصین پوست را از OCT پس از معاینه بصری بهتنهایی، یا معاینه بصری با درموسکوپ نشان دادند. این دو مطالعه به صورت تئوری نشان دادند که، در صورتی که OCT در گروهی با ۱۰۰۰ فرد مبتلا به ضایعات پوستی که تشخیص آنها دشوار است، استفاده شود، از این تعداد، ۶۰۰ نفر (۶۰%) در واقع مبتلا به BCC بودند، پس:
‐ برآورد ۶۶۲ نفر با یک نتیجه OCT تایید میکند که BCC وجود داشت و از این تعداد ۹۳ مورد (۱۴%) در واقع BCC ندارند (نتیجه مثبت‐کاذب)؛
‐ ۳۳۸ نفر با نتیجه OCT نشان میدهد که BCC وجود ندارد، ۳۱ مورد (۹%) در واقع BCC دارند (نتیجه منفی‐کاذب).
در مقایسه با تشخیص BCC با استفاده از معاینه بصری به همراه درموسکوپی، اضافه کردن OCT در این گروه تعداد نتایج مثبت‐کاذب را به ۸۷ مورد کاهش میدهد (بنابراین باعث کاهش اقدامات جراحی غیر‐ضروری میشود) و ۵۳ مورد BCC کمتر از دست خواهد رفت.
نتایج مطالعات این مرور چقدر قابل اعتماد هستند؟
در تمام مطالعات وارد شده، تشخیص سرطان پوست از طریق بیوپسی ضایعه (OCT/درموسکوپی مثبت) (بیوپسی شامل نمونهبرداری از سلولهای بدن و بررسی آنها زیر میکروسکوپ) و عدم وجود سرطان پوست از طریق بیوپسی (OCT/درموسکوپی منفی) انجام شد.* این احتمالا یک روش قابل اطمینان برای تصمیمگیری درباره این موضوع است که افراد واقعا سرطان پوست دارند یا خیر. با این حال، تعداد کمی از مطالعات وارد شده در این مرور و تنوع بین آنها، قابلیت اطمینان یافتهها را کاهش داد. مطالعات وارد شده محدودیتهای مهمی نیز داشتند، به ویژه درباره اینکه شرکتکنندگان در مطالعه از گروههای بسیار محدودی بودند که برای اسکن OCT در بالین مناسب بودند (به عنوان مثال تمام مطالعات شامل افراد مبتلا به ضایعات پوستی بودند که قبلا برای برداشتن از طریق جراحی انتخاب شده بودند)، در حالی که روش استفاده از OCT ممکن است شرایط زندگی واقعی را انعکاس ندهد.
نتایج این مرور برای چه کسانی قابل کاربرد است؟
مطالعات فقط در اروپا و ایالات متحده انجام شدند. میانگین سن (گزارش شده در فقط دو مطالعه) ۴۶ سال برای ملانوم و ۶۳ سال برای BCC بود. درصد افراد با تشخیص نهایی ملانوم ۲۳% و ۲۷% گزارش شد (در دو مطالعه)، از ۵۸% تا ۶۱% برای BCC (سه مطالعه) و ۱۸% برای Cscc (یک مطالعه) متغیر بود. برای تشخیص BCC، نتایج برای افراد مبتلا به ضایعات پوستی «صورتی» و «بدون رنگدانه» که پزشکان به سختی میتوانستند با چشم غیر‐مسلح به تنهایی آن را تشخیص دهند، اعمال شد.
پیامدهای این مرور چه هستند؟
تحقیقات کافی در مورد استفاده از OCT در تشخیص سرطانهای پوست انجام نشده است. نتایج این مرور نشان میدهد در صورتی که تشخیص ضایعات خوشخیم پوست دشوار است OCT میتواند به تشخیص BCC کمک کند، اما هنوز مشخص نیست که آیا میتوان BCC؛ cSCC و سرطانهای ملانوم پوست را بهطور مناسب تشخیص داد. برای مقایسه OCT با درموسکوپی و سایر تکنیکهای میکروسکوپی (مانند میکروسکوپ کانفوکال بازتابی (reflectance confocal microscopy))، انجام مطالعات بیشتر در گروههای به خوبی توصیف شده از افراد مبتلا به ضایعات پوستی مشکوک ضروری هستند.
این مرور تا چه تاریخی بهروزاست؟
نویسندگان مرور به دنبال یافتن و استفاده از مطالعاتی بودند که تا آگوست ۲۰۱۶ منتشر شدند.
* در این مطالعات بیوپسی یا پیگیری بالینی، مقایسههای استاندارد بودند.
۴۲ مطالعه را وارد کردیم، ۲۴ مطالعه به ارزیابی سیستمهای CAD مبتنی بر درموسکوپی دیجیتال (Derm‐CAD) در ۲۳ مطالعه کوهورت با ۹۶۰۲ ضایعه پرداختند (۱۲۲۰ مورد ملانوم، حداقل ۸۳ مورد BCC؛ ۹ مورد cSCC)، ۳۲ مجموعه داده برای Derm‐CAD و هفت مجموعه دادهای برای درموسکوپی ارائه کردند. هجده مطالعه، به ارزیابی CAD مبتنی بر اسپکتروسکوپی (Spectro‐CAD) در ۱۶ مطالعه کوهورت با ۶۳۳۶ ضایعه پرداختند (۹۳۴ ملانوم، ۱۶۳ مورد BCC؛ ۴۹ مورد cSCC)، ۳۲ مجموعه داده برای Derm‐CAD و شش مجموعه داده برای درموسکوپی ارائه کردند. این مجموعه شامل ۱۵ مطالعه استفاده کننده از تصویربرداری چند‐طیفی (multispectral imaging; MSI)، دو مطالعه استفاده کننده از اسپکتروسکوپی امپدانس الکتریکی (electrical impedance spectroscopy; EIS) و یک مطالعه استفاده کننده از اسپکتروسکوپی بازتابی منتشر شده (diffuse‐reflectance spectroscopy) بود. مطالعات ناقص گزارش شدند و در تمام حوزهها در معرض خطر نامشخص یا بالای سوگیری (bias) قرار داشتند. مطالعات وارد شده به دلیل فراوانی مطالعات با کیفیت پائین، گزارشدهی ضعیف و به کارگیری گروههایی با تعداد بالای شرکتکننده، به ندرت سوال مرور را بررسی کردند.
در سراسر سیستمهای CAD، ما تغییرات قابل توجهی را در تکنولوژیهای سختافزاری و نرمافزاری یافتیم، چند نوع الگوریتم طبقهبندی شده به کار گرفته شد، از روشهایی برای آموزش الگوریتمها استفاده شد، و کدام ویژگیهای مورفولوژیکی ضایعه در سراسر سیستمهای CAD و حتی بین مطالعات ارزیابی کننده سیستمهای CAD استخراج و تجزیهوتحلیل شد. متاآنالیز (meta–analysis) نشان داد که سیستمهای CAD دارای حساسیت بالایی برای تشخیص صحیح ملانوم پوستی مهاجم و انواع غیر‐معمول ملانوسیت داخل اپیدرم با تعداد جمعیت بالای وارد شده بودند، اما ویژگی کم و بسیار متغیر، به ویژه برای سیستمهای Spectro‐CAD داشتند. دادههای تجمعی از ۲۲ مطالعه حساسیت Derm‐CAD را برای تشخیص ملانوم ۹۰,۱%؛ (۹۵% فاصله اطمینان (CI)؛ ۸۴.۰% تا ۹۴.۰%) و ویژگی را ۷۴.۳%؛ (۹۵% CI؛ ۶۳.۶% تا ۸۲.۷%) تخمین زدند. دادههای تجمعی از هشت مطالعه، حساسیت تصویربرداری چند‐طیفی CAD؛ (MSI–CAD)؛ را ۹۲.۹%؛ (۹۵% CI؛ ۸۳.۷% تا ۹۷.۱%) و ویژگی را ۴۳.۶%؛ (۹۵% CI؛ ۲۴.۸% تا ۶۴.۵%) تخمین زدند. هنگامی که در یک جمعیت فرضی با ۱۰۰۰ ضایعه با میانگین ۲۰% شیوع ملانوم مشاهده شده اعمال شد، Derm‐CAD منجر به از دست دادن ۲۰ مورد ملانوم و منجر به ۲۰۶ نتیجه مثبت کاذب برای ملانوم خواهد شد. MSI‐CAD منجر به از دست دادن ۱۴ مورد ملانوم و ۴۵۱ مورد تشخیص کاذب برای ملانوم خواهد شد. یافتههای مقدماتی نشان میدهد که سیستمهای CAD حداقل به اندازه ارزیابی تصاویر درموسکوپیک برای تشخیص ملانوم تهاجمی و انواع غیر‐معمول ملانوسیت داخل اپیدرم حساس هستند. به دلیل کمبود مطالعات، قادر به ارائه گزارش خلاصه در مورد استفاده از CAD در جمعیتهای ارجاع داده نشده، یا دقت آن در تشخیص سرطانهای کراتینوسیت، یا استفاده از آن در هر شرایطی به عنوان یک هدف تشخیصی نبودیم.
چرا بهبود تشخیص سرطان پوست مهم است؟
چندین نوع سرطان مختلف پوست، از جمله ملانوم (melanoma)، کارسینوم سلول سنگفرشی (squamous cell carcinoma; SCC) و کارسینوم سلول بازال (basal cell carcinoma; BCC) وجود دارد. ملانوم یکی از خطرناکترین انواع سرطان است. اگر زود تشخیص داده نشود ممکن است درمان به تاخیر افتاده و به این ترتیب ملانوم به اندامهای دیگر بدن گسترش مییابد و در نهایت منجر به مرگومیر میشود. کارسینوم سلول سنگفرشی پوست (cutaneous squamous cell carcinoma; cSCC) و BCC کمتر خطرناک هستند، زیرا موضعی هستند (در مقایسه با ملانوم، کمتر احتمال دارد به سایر قسمتهای بدن گسترش یابد). با این حال، cSCC میتواند به سایر قسمتهای بدن گسترش یافته و اگر BCC زود تشخیص داده نشود میتواند منجر به آسیب شود. تشخیص سرطان پوست زمانی که واقعا وجود ندارد (نتیجه مثبت کاذب) ممکن است منجر به جراحی غیر‐ضروری و سایر بررسیها شده و باعث ایجاد استرس و اضطراب برای بیمار شود. از دست دادن تشخیص سرطان پوست ممکن است منجر به درمان اشتباه یا تاخیر در درمان موثر شود.
هدف از انجام این مرور چیست؟
هدف از این مرور کاکرین این بود که بدانیم تشخیص با کمک کامپیوتر (computer–assisted diagnosis; CAD) برای تشخیص ملانوم، BCC یا cSCC چقدر دقیق بود. این مرور همچنین دقت دو نوع مختلف CAD و دقت CAD را با تشخیص توسط یک پزشک با استفاده از یک میکروسکوپ تابش دستی (یک درموسکوپ یا «درموسکوپی» (dermoscopy)) مقایسه کرد. ۴۲ مطالعه را برای پاسخ به این سوالات وارد کردیم.
در این مرور چه موضوعی بررسی شد؟
چندین ابزار برای متخصصین سرطان پوست در دسترس هستند که اجازه بررسی دقیقتر پوست را در مقایسه با بررسی با چشم غیر‐مسلح میدهند. در حال حاضر یک درماتوسکوپ (dermatoscope) که ضایعات پوستی را (یک خال یا ناحیه پوست با ظاهر غیر‐معمول در مقایسه با پوست اطراف) با استفاده از یک منبع نور روشن بزرگتر نشان میدهد، توسط اغلب متخصصان سرطان پوست استفاده میشود. تستهای CAD سیستمهای کامپیوتری هستند که از اطلاعات مربوط به ضایعات پوستی به دست آمده از درماتوسکوپ یا تکنیکهای دیگری که از نور برای توصیف ویژگیهای ضایعه پوستی (اسپکتروسکوپی) استفاده میکنند، برای ارائه نتیجهای که نشان دهد احتمال دارد که سرطان پوست وجود داشته باشد یا خیر، تجزیهوتحلیل میکنند. سیستمهای CAD را وارد کردیم که اطلاعات خود را از تصاویر درموسکوپیک ضایعات (Derm‐CAD) به دست آوردند، یا از دادههای به دست آمده از اسپکتروسکوپی (spectroscopy) استفاده کردند. اغلب مطالعات مربوط به اسپکتروسکوپی از دادههای به دست آمده از تصویربرداری چند‐طیفی (MSI‐CAD) استفاده کردند و تمرکز اصلی در اینجاست. هنگامی که یک متخصص سرطان پوست در بررسی بصری با یا بدون درموسکوپی اضافی متوجه میشود که یک ضایعه مشکوک است، نتایج حاصل از سیستمهای CAD میتواند به تنهایی برای تشخیص سرطان پوست (تشخیص مبتنی بر CAD) استفاده شوند، یا میتواند به پزشکان کمک کند تا به همراه معاینه بصری در بررسی یک ضایعه پوستی به یک تشخیص برسند (تشخیص با کمک CAD). محققان بررسی کردند که سیستمهای CAD برای کمک به تشخیص سرطانهای پوست به همراه معاینه بصری و درموسکوپی چقدر مفید هستند.
نتایج اصلی این مرور چه هستند؟
این مرور ۴۲ مطالعه را وارد کرد که به بررسی سیستمهای CAD برای تشخیص ملانوم پرداختند. شواهد کافی برای تعیین دقت سیستمهای CAD برای تشخیص BCC (۳ مطالعه) یا cSCC (۱ مطالعه) وجود نداشت.
نتایج Derm‐CAD برای تشخیص ملانوم
نتایج اصلی برای Derm‐CAD بر اساس ۲۲ مطالعه شامل ۸۹۹۲ ضایعه است.
اعمال نتایج در یک گروه با ۱۰۰۰ ضایعه پوستی، از جمله ۲۰۰ مورد (۲۰%) با تشخیص نهایی* ملانوم، نتایج به دست آمده نشان میدهند که:
‐ تخمین زده میشود نتیجه Derm‐CAD در ۳۸۶ فرد نشان دهنده وجود ملانوم باشد، و از این تعداد ۲۰۶ مورد (۵۳%) در واقع ملانوم ندارند (نتیجه مثبت کاذب).
‐ ۶۱۴ فرد با نتیجه Derm‐CAD نشان میدهد که ملانوم وجود ندارد، ۲۰ مورد (۳%) در واقع ملانوم دارند (نتیجه منفی کاذب)
شواهدی وجود ندارد که نشان دهد درموسکوپی یا Derm‐CAD در توانایی تشخیص یا منتفی دانستن ملانوم متفاوت بودند.
نتایج MSI‐CAD برای تشخیص ملانوم
نتایج اصلی MSI‐CAD بر اساس هشت مطالعه شامل ۲۴۰۱ ضایعه است. در یک گروه ۱۰۰۰ نفری، که ۲۰۰ نفر (۲۰%) در واقع مبتلا به ملانوم هستند*، پس:
‐ تخمین اینکه ۶۳۷ نفر یک نتیجه MSI‐CAD دارند نشان میدهد که ملانوم وجود دارد، و از این تعداد ۴۵۱ نفر (۷۱%) در واقع ملانوم ندارند (نتیجه مثبت کاذب)
‐ ۳۶۳ نفر با نتیجه MSI‐CAD نشان میدهد که ملانوم وجود ندارد، ۱۴ فرد (۴%) در واقع ملانوم دارند (نتیجه منفی کاذب)
MSI‐CAD ملانومهای بیشتری را تشخیص میدهد، اما احتمالا نتایج مثبت کاذب بیشتری را به دست میدهد (افزایش جراحی غیر‐ضروری).
نتایج مطالعات این مرور چقدر قابل اعتماد هستند؟
گزارشدهی ناقص مطالعات قضاوت را در مورد اینکه چقدر قابل اعتماد هستند برای ما دشوار ساخت. اغلب مطالعات محدودیتهای مهمی داشت. برخی از مطالعات فقط شامل انواع خاصی از ضایعات پوستی بودند یا ضایعاتی را که تشخیص آنها دشوار بود از مطالعه حذف کردند. مهمتر از همه، اغلب مطالعات فقط ضایعات پوستی را با نتیجه بیوپسی وارد کردند، بدین معنا که فقط یک نمونه از ضایعات وارد شد که در عمل توسط پزشک ویزیت شد. این ویژگیها ممکن است منجر به سیستمهایی از CAD شوند که از نظر دقت، بیشتر یا کمتر از آنچه در واقع هستند به نظر برسند.
نتایج این مرور برای چه کسانی کاربرد دارد؟
مطالعات عمدتا در اروپا (۲۹، ۶۹%) و آمریکای شمالی (۸، ۱۹%) انجام شدند. میانگین سنی (در ۶/۴۲ مطالعه گزارش شد) بین ۳۲ تا ۴۹ سال برای ملانوم بود. در سراسر مطالعات، درصد افراد با تشخیص نهایی بیماری سل از ۱% تا ۵۲% متغیر بود. اینکه همیشه بتوان گفت که سوءظن در مورد سرطان پوست در شرکتکنندگان مطالعه بر اساس معاینه بالینی بهتنهایی بوده یا بر اساس بررسی بالینی و درموسکوپیک، امکانپذیر نبود. تقریبا تمام مطالعات درباره افراد مبتلا به ضایعات پوستی انجام شدند که به جای پزشکان مراکز مراقبتهای اولیه در کلینیکهای تخصصی ویزیت شدند.
کاربردهای این مرور چه هستند؟
سیستمهای CAD به نظر میرسد برای شناسایی ملانوم در ضایعات پوستی که بر اساس بررسی بالینی برای اکسیزیون وارد شدهاند (معاینه بصری و درموسکوپی) دقیق باشند. این امر امکانپذیر است که برخی از سیستمهای CAD، نسبت به پزشکانی که از تصاویر درموسکوپی استفاده میکنند ملانومهای بیشتری را تشخیص دهند. با این حال، سیستمهای CAD همچنین باعث تشخیصهای مثبت‐کاذب بسیار بیشتری نسبت به درموسکوپی میشود، و میتواند منجر به افزایش قابل توجهی در جراحی غیر‐ضروری شود. عملکرد سیستمهای CAD برای تشخیص سرطان پوست BCC و cSCC نامشخص است. برای ارزیابی استفاده از CAD توسط پزشکان برای تشخیص سرطان پوست در مقایسه با تشخیص رو‐در‐رو با استفاده از درموسکوپی، هم در مراکز مراقبتهای اولیه و هم در درمانگاههای تخصصی سرطان پوست، مطالعات بیشتری مورد نیاز هستند.
این مرور تا چه زمانی بهروز است؟
نویسندگان مرور به دنبال یافتن و استفاده از مطالعاتی بودند که تا آگوست ۲۰۱۶ منتشر شدند.
* در این مطالعات، بیوپسی، پیگیری بالینی، یا تشخیص پزشک متخصص، استاندارد مرجع بودند (ابزار تایید تشخیص نهایی).
شش مطالعه را انتخاب کردیم، که ۲۹ مجموعه دادهای را ارائه کردند: ۲۰ مجموعه برای تشخیص ملانوم (۱۱۲۵ ضایعه و ۲۴۲ ملانوم) و ۹ مجموعه برای تشخیص BCC (۹۹۳ ضایعه و ۱۱۹ مورد BCC). هیچ دادهای را در رابطه با تشخیص cSCC شناسایی نکردیم.
مطالعات بهطور کلی ضعیف گزارش شدند، که قضاوتها را در مورد کیفیت روششناسی آنها محدود کردند. نیمی از مطالعات برای تعیین دقت تست تنظیم نشدند، و تمام مطالعات در مرحله اول باید از نظر پتانسیل مفید بودن HFUS ارزیابی شوند. در خصوص قابلیت کاربرد یافتهها به دلیل جمعیتهای انتخابی مطالعات و آستانه دادههای ارائه شده برای مثبت بودن تست، نگرانیهای بسیار خاصی وجود داشت. مطالعات گزارش دهنده ارزیابی کیفی تصاویر HFUS، تا ۲۲% از ضایعات (از جمله برخی از ملانومها) را به علت عدم بزرگنمایی در تست حذف کردند.
حساسیتهای به دست آمده برای ویژگیهای کیفی HFUS در تشخیص ملانوم حداقل ۸۳% بود (۹۵% CI؛ ۷۵% تا ۹۰%)؛ ترکیبی از سه ویژگی (ضایعات به ظاهر هیپواکو، همگون و با تمایز خوب) نشان دهنده حساسیت ۱۰۰% در دو مطالعه (حد پائین: ۹۵% CI؛ ۹۴% و ۸۲%)، به ترتیب با ویژگیهای متغیر و متناظر برابر با ۳۳% (۹۵% CI؛ ۲۰% تا ۴۸%) و ۷۳% (۹۵% CI؛ ۵۷% تا ۸۵%) بودند. معیارهای کمّی خروجیهای HFUS در دو مطالعه، آستانه تصمیمگیری فعال را برای به دست آوردن حساسیت ۱۰۰%؛ ویژگی ۹۳% (۹۵% CI؛ ۷۷% تا ۹۹%) و ۶۵% (۹۵% CI؛ ۵۱% تا ۷۶%) تعیین کرد. با توجه به حساسیتها و ویژگی بسیار متغیر، امکان ارائه گزارش خلاصه در رابطه با دقت HFUS در تشخیص BCC وجود نداشت.
چرا بهبود تشخیص سرطان پوست مهم است؟
چندین نوع سرطان پوست مختلف وجود دارد. ملانوم یکی از خطرناکترین انواع سرطان است، بنابراین مهم است که زود تشخیص داده شده و در اسرع وقت برداشته شود. شکست در تشخیص ملانوم (تحت عنوان نتیجه تست منفی‐کاذب شناخته میشود) میتواند درمان را به تاخیر انداخته، منجر به گسترش ملانوم به سایر اندامهای بدن و احتمالا مرگ زودرس بیمار شود. سایر سرطانهای پوست، مانند کارسینوم سلولهای سنگفرشی پوست و کارسینوم سلولهای بازال، بیشتر موضعی هستند. با این وجود، کارسینوم سلولهای سنگفرشی پوست در صورت عدم درمان میتواند به سایر قسمتهای بدن گسترش یابد و کارسینوم سلولهای بازال در صورت عدم درمان میتواند منجر به بد‐شکلی شود. تشخیص یک ضایعه بیخطر (یک خال یا ضایعه پوستی با ظاهر غیر‐معمول در مقایسه با پوست اطراف) به عنوان سرطان پوست (یک نتیجه مثبت‐کاذب) ممکن است منجر به انجام جراحی غیر‐ضروری و سایر تستها شود که خود باعث ایجاد استرس و اضطراب در بیمار میشود. تشخیص اشتباه یک نوع سرطان پوست به جای نوع دیگر ممکن است به درمان اشتباه یا تاخیر در درمان موثر بیانجامد. بنابراین، تشخیص صحیح مهم است.
هدف این مرور چیست؟
ما میخواستیم بدانیم انجام اولتراسوند با فرکانس بالا میتواند به پزشکان در تشخیص سرطان پوست کمک کند یا خیر. برای بررسی و پاسخ به این سوال شش مطالعه را یافتیم. پنج مطالعه تشخیص ملانوم، و سه مطالعه، کارسینوم سلولهای بازال را مورد بررسی قرار دادند.
چه چیزی در این مرور مورد بررسی قرار گرفت؟
چندین ابزار به متخصصان سرطان پوست اجازه میدهد تا پوست را بسیار دقیقتر از چشم غیر‐مسلح بهتنهایی بررسی کنند. اغلب متخصصان سرطان پوست در حال حاضر از یک درماتوسکوپ استفاده میکنند، که با استفاده از نور طبیعی ضایعات پوستی را بزرگتر نشان میدهد. اولتراسوند یکی دیگر از روشهای غیر‐تهاجمی است که انعکاس موج صدای حاصل از بافت بدن را اندازهگیری میکند. اولتراسوند با فرکانس بالا میتواند یک تصویر با کیفیت خوب از ساختارهای نزدیک به سطح پوست تولید کند. هنگامی که این پروسیجر در کنار معاینه پزشک و درموسکوپی استفاده میشود، میتواند به تشخیص دقیقتر پزشکان کمک کند.
نتایج اصلی این مرور چه هستند؟
این مرور شامل شش مطالعه بود: پنج مطالعه در مورد ۱۱۲۵ ضایعه پوستی مشکوک به ملانوم و سه مطالعه در مورد ۹۹۳ ضایعه مشکوک به کارسینوم سلولهای بازال. ما هیچ مطالعهای را در مورد تشخیص کارسینوم سلولهای سنگفرشی پوست نیافتیم.
مطالعات وارد شده کوچک و بسیار متفاوت از یکدیگر بودند به نحوی که امکان برآوردهای قابل اعتماد درباره دقت برای شناسایی ملانوم یا کارسینوم سلولهای بازال فراهم نشد. نیمی از آنها در واقع برای تعیین دقت تست طراحی نشدند و تمام آنها میتوانند در بررسیهای اولیه ارزش بالقوه اولتراسوند با فرکانس بالا در نظر گرفته شوند. ارزش اصلی این مطالعات ممکن است در کمک به محققان برای شناسایی بهترین روش تفسیر اولتراسوند با فرکانس بالا در تشخیص ملانوم یا کارسینوم سلولهای بازال برای ارزیابی در مطالعات تحقیقاتی آینده باشد.
این نتایج چقدر قابل اعتماد هستند؟
نتایج مطالعه زمانی که به صورت مجموعه در نظر گرفته میشوند، بسیار قابل اعتماد نیستند. تعداد اندک و تنوع بین مطالعات قابلیت اطمینان را کاهش میدهد، درحالیکه تمام مطالعات دارای محدودیتهای مهمی بودند. بهطور خاص، افرادی که در این مطالعات شرکت میکنند و نحوه استفاده از این تستها ممکن است شرایط زندگی واقعی را منعکس نکنند. در تمامی مطالعات تشخیص نهایی با بیوپسی تایید شد. این روش احتمالا یک روش قابل اعتماد برای تصمیمگیری درباره این موضوع است که بیماران واقعا مبتلا به سرطان پوست بودند یا خیر*.
نتایج این مرور برای چه کسانی قابل کاربرد است؟
مطالعات در اروپا صورت گرفتند، و فقط یک مطالعه میانگین سن شرکتکنندگان را گزارش کرد (۵۵,۳ سال). درصد افرادی که دارای تشخیص نهایی ملانوم بودند بین ۱۴% تا ۵۸% متغیر بود، در حالی که ۸% تا ۴۹% مبتلا به کارسینوم سلولهای بازال بودند. نمیتوان گفت که پزشکان بر اساس معاینه بالینی بهتنهایی یا معاینه بالینی و درموسکوپی مشکوک به سرطان پوست میشوند.
کاربردهای این مرور چه هستند؟
در حال حاضر، تحقیقات کافی برای نتیجهگیری در مورد استفاده از اولتراسوند با فرکانس بالا برای تشخیص سرطانهای پوست وجود ندارد. نتایج این مرور نشان میدهد که اولتراسوند با فرکانس بالا پتانسیل جداسازی ملانوم یا کارسینوم سلولهای بازال را از برخی از انواع ضایعات بیخطر دارد، اما هنوز مشخص نیست که میتواند این سرطانهای پوست را از طیف وسیعی از بیماریهای پوستی که بیماران به پزشک خود در بالین روزانه نشان میدهند، تمیز دهد یا خیر. نیاز به انجام مطالعات بیشتری در مورد اولتراسوند با فرکانس بالا در کنار درموسکوپی یا سایر تکنیکهای میکروسکوپی (مانند میکروسکوپ کانفوکال بازتابی (reflectance confocal microscopy)) در افراد مبتلا به ضایعات پوستی وجود دارد.
این مرور تا چه تاریخی بهروز است؟
نویسندگان مرور به دنبال یافتن و استفاده از مطالعاتی بودند که تا آگوست ۲۰۱۶ منتشر شدند.
* در این مطالعات بیوپسی مرجع استاندارد بود (ابزار تائید تشخیص نهایی).
۴۹ گزارش منتشر شده را با مجموع ۵۱ مطالعه کوهورت و ۳۴,۳۵۱ ضایعه (شامل ۲۴۹۹ مورد) در این مرور وارد کردیم که ۱۳۴ بانک اطلاعاتی را از معاینه بصری فراهم کرده بودند. تقریبا در تمام حوزههای کیفیت مطالعه، اطلاعات لازم برای قضاوت درباره خطر سوگیری (bias) ناکافی بود، در سه حوزه از چهار حوزهای که ما ارزیابی کردیم نگرانیها درباره قابلیت کاربرد یافتهها بالا بود. خصوصا استخدام گزینشی شرکتکنندگان، فقدان جزئیات درباره آستانه تصمیمگیری در مورد نتیجه تست مثبت و فقدان جزئیات درباره مهارت ناظر مشکلساز بودند.
تجزیهوتحلیل مطالعات از طریق درجه تست قبلی توسط فقدان اطلاعات مرتبط و به وسیله ضایعات محدود گزینش شده برای بیوپسی یا اکسیزیون (excision) ممکن نبود. دقت برای تشخیص in‐person در مقایسه با ارزیابی تصویر‐محور بالاتر بود (نسبت شانس تشخیص نسبی: ۸,۵۴؛ ۹۵% CI؛ ۲.۸۹ تا ۲۵.۳؛ P < ۰.۰۰۱). متاآنالیز ارزیابی in‐person که میتوانست در مسیر بالینی قرار گیرد، نشان داد که trade‐off کلی بین حساسیت و ویژگی در شرکتکنندگان با تست قبلی محدود (n = ۳ مجموعه داده) بالاترین حساسیت (۹۲.۴%؛ ۹۵% CI؛ ۲۶.۲% تا ۹۹.۸%) و پائینترین ویژگی (۷۹.۷%؛ ۹۵% CI؛ ۷۳.۷% تا ۸۴.۷%) را دربردارد. حساسیتها درباره کسانی که برای ارزیابی به متخصص ارجاع شدهاند پائینتر بود اما ویژگی درباره انتخاب ضایعات برای اکسیزیون (n = ۸ مجموعه داده) بالاتر بود (حساسیت ۷۶.۷%؛ ۹۵% CI؛ ۶۱.۷% تا ۸۷.۱% و ویژگی ۹۵.۷%؛ ۹۵% CI؛ ۸۹.۷% تا ۹۸.۳%). این تفاوتها ناشی از تفاوتهایی در زمینه طیف ضایعات وارد شده، تفاوتها در تعریف نتیجه تست مثبت، یا تغییرات در مهارت ناظر بود. ما شواهد آشکاری را نیافتیم که نشان دهد دقت تشخیصی به وسیله استفاده از هر الگوریتم در همه مراکز بهبود پیدا کرده یا خیر. بررسی تاثیر مهارت ناظر در تشخیص ملانوما به دلیل گزارشدهی ضعیف قابل انجام نبود.
هدف از انجام این مرور چیست؟
ملانوما (melanoma) یکی از خطرناکترین اشکال سرطان پوست است. هدف این مرور کاکرین یافتن این نکته بود که دقت چک کردن ضایعات پوستی (تودهها (lumps)، نواحی برآمده (bumps)، زخمها، خراشها و نواحی خارانده شده (scratches or grazes) با چشم غیر‐مسلح (معاینه بصری) جقدر میتواند منجر به تشخیص ملانوما شود (دقت تشخیصی). همچنین در این مرور، این موضوع نیز بررسی شد که دقت تشخیصی با حضور بیمار و نگاه چهرهبهچهره پزشک به بیمار (معاینه بصری in‐person) متفاوت از بررسی تصاویر ضایعه بدون حضور بیمار (معاینه بصری تصویر‐محور) است یا خیر. محققین کاکرین ۱۹ مطالعه را برای پاسخ به این سوال وارد کردند.
چرا دانستن دقت تشخیصی معاینه بصری ضایعات پوستی مشکوک به ملانوما مهم است؟
عدم تشخیص ملانوما وقتی که ملانوما واقعا هست (نتیجه تست منفی کاذب)، میتواند موجب تاخیر در جراحی (اکسیزیون (excision)) شود، این نکته خطر پخش سرطان را به ارگانهای دیگر بدن افزایش میدهد و احتمال مرگومیر را بالا میبرد. تشخیص یک ضایعه پوستی (یک مول یا ناحیهای از پوست با ظاهری غیر‐معمول در مقایسه با پوست اطراف آن) به عنوان ملانوما وقتی که آن ضایعه ملانوما نیست (مثبت کاذب) ممکن است باعث جراحی غیر‐ضروروی، بررسیهای بیشتر و نگرانی بیمار شود. معاینه بصری ضایعات مشکوک پوستی توسط پزشکان با چشم غیر‐مسلح اولین قدم در مجموعه تست تشخیص ملانوما است. دانستن دقت تشخیصی معاینه بصری مهم است چون بر اساس آن میتوان تصمیم گرفت که تستهای اضافی مانند بیوپسی (برداشتن بخشی از ضایعه برای بررسی زیر میکروسکوپ) برای بهبود دقت به یک سطح قابل قبول لازم هستند یا خیر.
در این مرور چه موضوعی مطالعه شد؟
محققین میخواستند بدانند دقت تشخیصی in‐person در مقایسه با معاینه تصویر‐محور ضایعات پوستی چقدر است؟ محققین همچنین میخواستند بدانند اگر پزشکان از چکلیست معاینه بصری برای تشخیص استفاده کنند دقت تشخیصی بهبود مییابد یا اینکه دقت به مهارت و تجربه معاینهگر وابسته است (سطح مهارت بالینی). محققین ابتدا دقت تشخیصی اولین معاینه بصری ضایعه را مثلا توسط یک پزشک عمومی مد نظر قرار دادند، سپس وقتی ضایعات به یک درماتولوژیست ارجاع شده بود دقت تشخیصی را توسط درماتولوژیست بررسی کردند.
نتایج اصلی این مرور چه هستند؟
فقط ۱۹ مطالعه (۱۷ تا in‐person و ۲ مطالعه تصویر‐محور) بهطور واضحی مشخص کرده بودند که این تست اولین معاینه بصری ضایعه بود یا اینکه معاینه بصری به دنبال ارجاع بوده است (مثلا وقتی بیمار توسط GP به متخصص پوست برای معاینه بصری ارجاع شده است).
اولین معاینه بصری in‐person (۳ مطالعه)
نتایج این مطالعات از ۱۳۳۹ ضایعه پوستی نشان داد که در گروه ۱۰۰۰ ضایعه، ۹۰ تا از آنها (۹%) واقعا ملانوما هستند.
تخمینی از نتیجه ۲۶۸ معاینه بصری نشان داد که ملانوما وجود داشته است. از این تعداد، ۱۸۵ تا ملانوما نبودند و نتیجه یک بیوپسی غیر‐ضروری بود (نتیجه مثبت کاذب).
‐ تخمینی از نتیجه ۷۳۲ معاینه بصری نشان داد که ملانوما وجود نداشته است. از این تعداد، هفت مورد واقعا ملانوما بودند و برای بیوپسی فرستاده نشده بودند (نتیجه منفی کاذب).
دو مطالعه محدود به ۴۲۲۸ ضایعه مشکوک پوستی بود که برای برداشتن ضایعه وارد شده بودند، نتایج مشابه داشت.
معاینه بصری in‐person بعد از ارجاع همه ضایعات برای برداشتن وارد شده بودند (۸ مطالعه)
نتایج هشت مطالعه از ۵۳۳۱ ضایعه مشکوک پوستی نشان داد که در گروه ۱۰۰۰ ضایعه، ۹۰ تا از آنها (۹%) واقعا ملانوما بودند.
‐ یک تخمین از نتیجه ۱۰۸ معاینه بصری نشان داد ملانوما وجود داشته و از این تعداد، ۳۹ مورد ملانوما نبودند و نتیجه یک بیوپسی غیر‐ضروری بود (نتیجه مثبت کاذب).
‐ از ۸۹۲ معاینه بصری نشان داد که ملانوما وجود نداشته است، از این تعداد، ۲۱ مورد واقعا ملانوما بودند و برای بیوپسی فرستاده نشده بودند (نتیجه منفی کاذب).
بهطور کلی تعداد نتایج مثبت کاذب (تشحیص ضایعه پوستی به عنوان ملانوما وقتی که ملانوما نیست) برای معاینه بصری ضایعات مشکوک پوستی در مقایسه با معاینه بصری به دنبال ارجاع، بالاتر بود و تعداد نتایج منفی کاذب (عدم تشخیص ملانوما وقتی که ملانوما هست) پائینتر بود.
معاینه بصری تصاویر ضایعات مشکوک پوستی (۲ مطالعه)
دقت برای معاینه بصری تصاویر ضایعات در مقایسه با معاینه بصری in‐person بسیار پائینتر بود.
ارزش چکلیست معاینه بصری
شواهدی وجود ندارد مبنی بر اینکه استفاده از چکلیست معاینه بصری یا سطح مهارت بالینی دقت تشخیصی را تغییر میدهد.
نتایج مطالعات این مرور چقدر قابل اعتماد است؟
تشخیص ملانوما با بیوپسی داده شد و عدم ملانوما در اکثر مطالعات وارد شده با بیوپسی تایید شد، همچنین با پیگیری در طول زمان مطمئن شدیم که تشخیص منفی ملانوما پایدار بود یا خیر. در این مطالعات بیوپسی، پیگیری بالینی یا تشخیص پزشک متخصص معیارهای مرجع (به معنای تثبیت تشخیص نهایی) بودند. بیوپسی یا پیگیری احتمالا روشهای قابل اعتمادی برای تصمیمگیری درباره ملانوما بودن یک ضایعه هستند. در مطالعات اندکی تشخیص فرد ماهر از نبود ملانوما احتمالا روش قابل اعتمادی نیست تا بر اساس آن درباره اینکه واقعا بیمار ملانوما دارد یا نه، تصمیم گرفته شود. تغییرات زیادی در نتایج مطالعات در این مرور وجود داشت و روش مطالعات همیشه بهطور کامل توضیح داده نشده بود و این موضوع ارزیابی قابلیت اطمینان نتایج را مشکل میسازد.
نتایج این مرور برای چه کسانی کاربرد دارد؟
سیزده مطالعه در اروپا انجام شده بود (۶۸%)، باقی مطالعات در آسیا (n = ۱)، اقیانوسیه (۴ = n) و امریکای شمالی (۱ = n) انجام شده بود. میانگین سن بیماران بین ۳۰ و ۷۳,۶ سال بود (در ۱۰ مطالعه گزارش شده بود). درصد افراد مبتلا به ملانوما بین ۴% تا ۲۰% در اولین معاینه ضایعات و بین ۱% تا ۵۰% در مطالعات با ضایعات ارجاعی بود. در اکثر مطالعات ضایعات احتمالا نمایش دهنده طیفی از ضایعاتی نبودند که در عمل دیده میشوند، مثلا فقط ضایعاتی با اندازه خاص یا با ظاهر مشخص وارد شده بودند. علاوه بر این تبحر متفاوت پزشکانی که معاینه بصری را انجام میدادند و تعاریف متفاوت استفاده شده برای بودن یا نبودن ملانوما در مطالعات باعث شده بود که مشخص نباشد درموسکوپی چگونه و توسط چه کسی معاینه بصری باید انجام شود تا دقت دیده شده در مطالعات به دست آید.
کاربردهای این مرور چه هستند؟
نرخ خطای معاینه بصری خیلی بالا است و بنابراین اتکا به آن به تنهایی ممکن نیست. نیاز است فناوریهای دیگر استفاده شوند تا دقت تشخیصی سرطان پوست افزایش یابد، البته این فناوریها در این مرور ارزیابی نشدند. تغییرات قابل توجه و عدم قطعیت درباره دقت تشخیصی معاینه بصری فقط در تشخیص ملانوما وجود دارد. شواهدی وجود ندارد مبنی بر اینکه چکلیستهای معاینه بصری بهطور قابل اعتمادی دقت تشخیصی معاینه بصری را بهبود میبخشند، بنابراین نمیتوان توصیههایی ارائه کرد مبنی بر اینکه چه هنگام این چکلیستها استفاده شوند. علیرغم وجود مطالعات پژوهشی بیشمار، مطالعات بیشتر و با طراحی مناسب نیاز است تا دقت تشخیصی معاینه بصری با همراهی چکلیستها و بدون آنها و به وسیله پزشکان با سطوح متفاوت مهارت ارزیابی شوند.
این مرور تا چه زمانی بهروز است؟
نویسندگان این مرور به جستوجوی مطالعات مرتبط پرداختند و از مطالعاتی استفاده کردند که تا آگوست ۲۰۱۶ منتشر شده بودند.
در مجموع ۱۰۴ مطالعه منتشر شده را که گزارشی از ۱۰۳ مطالعه کوهورت با ۴۲۷۸۸ ضایعه (شامل ۵۷۰۰ مورد) بود، در این مرور گنجاندیم، ۳۵۴ مجموعه داده در این مطالعات درباره درموسکوپی وجود داشت. خطر سوگیری (bias) برای تست شاخص (index test) و حوزههای استاندارد مرجع پائین بود اما در زمینه انتخاب شرکتکننده و روند گردش شرکتکنندگان (participant flow) بالا یا نامشخص بود. نگرانیها درباره قابلیت کاربرد یافتههای مطالعه در سه تا از چهار حوزه ارزیابی شده «بالا» بود. خصوصا در زمینه استخدام گزینشی شرکتکنندگان، فقدان قابلیت تکرارپذیری (reproducibility) آستانه تشخیص و فقدان جزئیات مربوط به مهارت ناظر مشکلساز بودند.
دقت درموسکوپی برای شناسایی ملانومای تهاجمی یا انواع ملانوسیتیک اینترااپیدرمال آتیپیک در ۸۶ مجموعه داده گزارش شده بود: ۲۶ مورد برای ارزیابی درموسکوپی انجام شده به صورت in ‐erson (درموسکوپی به همراه معاینه بصری) و ۶۰ مورد برای ارزیابی تصویر‐محور (تشخیص مبتنی بر تصویرهای درموسکوپیک). تجزیهوتحلیل مطالعات با تستهای قبلی هیچ تاثیر واضحی را برای دقت درموسکوپی نشان نداد، البته فقدان مطالعات در مراقبت اولیه، فقدان اطلاعات مرتبط و ضایعات محدود وارد شده برای بیوپسی یا اکسیزیون مانع از انجام تجزیهوتحلیل بودند. دقت برای تشخیص in‐person در مقایسه با ارزیابی تصویر‐محور بالاتر بود (نسبت شانس تشخیصی نسبی (relative diagnostic odds ratio; RDOR): ۴,۶؛ ۹۵% فاصله اطمینان (CI): ۲.۴ تا ۹.۰؛ P < ۰.۰۰۱).
دقت را برای این دو مورد زیر مقایسه کردیم: a) ارزیابی in‐person از درموسکوپی (۲۶ ارزیابی؛ ۲۳,۱۶۹ ضایعه و ۱۶۶۴ ملانوما) در برابر معاینه بصری به تنهایی (۱۳ ارزیابی؛ ۶۷۴۰ ضایعه و ۴۵۹ ملانوما)، و b) ارزیابی تصویر‐محور درموسکوپی (۶۰ ارزیابی؛ ۱۳,۴۷۵ ضایعه و ۲۸۵۱ ملانوما) در برابر معاینه بصری تصویر‐محور (۱۱ ارزیابی؛ ۱۷۴۰ ضایعه و ۳۰۵ ملانوما). در هر دو مقایسه، متاآنالیز نشان داد که درموسکوپی دقیقتر از معاینه بصری بهتنهایی است؛ با RDORها (a): ۴,۷؛ (۹۵% CI؛ ۳.۰ تا ۷.۵؛ P < ۰.۰۰۱) و (b): ۵.۶؛ (۹۵% CI؛ ۳.۷ تا ۸.۵؛ P < ۰.۰۰۱). برای a) تفاوت پیشبینی شده در حساسیت در ویژگی ثابت ۸۰%، معادل ۱۶% بود (۹۵% CI؛ ۸% تا ۲۳%؛ ۹۲% برای درموسکوپی + معاینه بصری در برابر ۷۶% برای معاینه بصری) و تفاوت پیشبینی شده در ویژگی در حساسیت ثابت ۸۰%، معادل ۲۰% بود (۹۵% CI؛ ۷% تا ۳۳%؛ ۹۵% برای درموسکوپی + معاینه بصری در برابر ۷۵% برای معاینه بصری). برای b) تفاوت پیشبینی شده در حساسیت، در ویژگی ثابت ۸۰%، معادل ۳۴% بود (۹۵% CI؛ ۲۴% تا ۴۶%؛ ۸۱% برای درموسکوپی در برابر ۴۷% برای معاینه بصری)، و تفاوت پیشبینی شده در ویژگی معادل ۴۰% بود (۹۵% CI؛ ۲۷% تا ۵۷%؛ ۸۲% برای درموسکوپی در برابر ۴۲% برای معاینه بصری) در حساسیت ثابت ۸۰%.
با استفاده از میانه شیوع بیماری در هر مجموعه مطالعه ((a)؛ ۱۲% برای in‐person و (b)؛ ۲۴% برای تصویر‐محور)، برای یک جمعیت فرضی با ۱۰۰۰ ضایعه، افزایشی در حساسیت (a)؛ ۱۶% (in‐person) و (b)؛ ۳۴% (تصویر‐محور)، استفاده از درموسکوپی در یک اخصاصیت ثابت ۸۰% معادل با کاهشی در تعداد ملانومای تشخیص داده نشده (missed) از (a)، ۱۹ و (b)، ۸۱ با (a)، ۱۷۶ و (b)، ۱۵۲ نتیجه مثبت کاذب. یک افزایش در ویژگی (a)؛ ۲۰% (in‐person)، و (b)؛ ۴۰% (تصویر‐محور)، در حساسیت ثابت ۸۰% معادل با کاهشی در تعداد برداشتن غیر‐ضروری با استفاده از درموسکوپی (a)، ۱۷۶ و (b)، ۳۰۴ با (a)، ۲۴ و (b)، ۴۸ ملانومای تشخیص داده نشده.
استفاده از یک الگوریتم معلوم (named) و منتشر شده برای کمک به ارزیابی تفسیر درموسکوپی (در تضاد با عدم الگوریتم گزارش شده یا استفاده از تجزیهوتحلیل الگوی گزارش شده) نشان داد که هیچ تاثیر معناداری در دقت ارزیابی با in‐person؛ (RDOR: ۱,۴؛ ۹۵% CI؛ ۰.۳۴ تا ۵.۶؛ P = ۰.۱۷) یا تصویر‐محور (RDOR: ۱.۴؛ ۹۵% CI؛ ۰.۶۰ تا ۳.۳؛ P = ۰.۲۲) وجود ندارد. این نتیجه با تجزیهوتحلیل زیر‐گروه مطابق با الگوریتم استفاده شده تایید شد. ما دریافتیم انجام درموسکوپی توسط ناظرانی که تجربه بیشتری داشتند و به مثابه «مشاوران ماهر» (expert consultants) طبقهبندی شده بودند، در مقایسه با ناظرانی که تجربه کمتری داشتند، دقت درموسکوپی بالاتر بود، خصوصا در مورد ارزیابی تصویر‐محور. شواهد برای تاثیر آموزش درموسکوپی بر تست دقت، بسیار محدود بود اما بهبودی را در حساسیت نشان میداد.
هدف از انجام این مرور چیست؟
هدف این مرور کاکرین یافتن ارزش دقت درموسکوپی در تشخیص ملانوما (melanoma) در مقایسه با معاینه بصری پوست با چشم غیر‐مسلح بود. در این مرور این موضوع بررسی شد که دقت تشخیص با استفاده از درموسکوپی (dermoscopy) روی بیمار به صورت in‐person با دقت تشخیصی استفاده از تصویرهای درموسکوپیک پوست متفاوت است یا خیر. محققین کاکرین ۱۰۴ مطالعه را برای پاسخ به این سوال در این مرور وارد کردند.
چرا بهبود تشخیص ملانوما مهم است؟
ملانوما یکی از خطرناکترین اشکال سرطان پوست است. عدم تشخیص به موقع ملانوما (نتیجه یک تست منفی‐کاذب) و تاخیر در جراحی باعث پخش سرطان به ارگانهای دیگر شده و ممکن است موجب مرگومیر شود. تشخیص یک ضایعه پوستی (یک مول یا ناحیهای از پوست با ظاهری غیر‐معمول در مقایسه با پوست اطراف آن) به عنوان ملانوما، وقتی که آن ضایعه ملانوما نیست (مثبت کاذب)، ممکن است باعث جراحی غیر‐ضروری، بررسیهای بیشتر و نگرانی بیمار شود. معاینه بصری ضایعات مشکوک پوستی توسط متخصصان بالینی با چشم غیر‐مسلح اولین قدم در مجموعه تست تشخیص ملانوما است. تکنیکهای بزرگنمایی میتوانند توسط متخصصان سرطان پوست استفاده شوند تا معاینه دقیقتری از ضایعات مشکوک نسبت به چشم غیر‐مسلح فراهم آورند.
در این مرور چه موضوعی بررسی شد؟
درموسکوپی یک ابزار دستی (handheld) با استفاده از نور مرئی (مانند نورهای لامپ رشتهای یا لامپهای LED) است که میتوان از آن به عنوان بخشی از معاینه بالینی ضایعات مشکوک پوست استفاده کرد. درموسکوپی یک ابزار مهم برای تشخیص توسط متخصصان بالینی متخصص است و بهطور فزایندهای در وضعیت مراقبتهای اولیه استفاده میشود. دانستن دقت تشخیصی درموسکوپی به همراه معاینه بصری برای فهم اینکه چه کسی باید از آن استفاده کند و در چه وضعیت مراقبت سلامت به کار گرفته شود، مهم است.
محققین درصدد یافتن دقت تشخیصی درموسکوپی برای ضایعات مشکوک پوستی روی بیماران in‐person و با استفاده از تصویرهای درموسکوپیک در مقایسه با معاینه بصری تنها بودند. آنها همچنین میخواستند بدانند که دقت تشخیصی با استفاده چک لیست (checklist) درموسکوپی بهبود مییابد یا با افزایش سطح تبحر بالینی فرد انجام دهنده.
نتایج اصلی این مرور چه هستند؟
این مرور شامل ۱۰۴ مطالعه بود که دربرگیرنده افراد مبتلا به ضایعات مشکوک به ملانوما بودند. نتایج اصلی برای تشخیص ملانوما (شامل تشخیص بسیار زودهنگام ملانوما) بر ۸۶ مطالعه مبتنی بودند، ۲۶ مورد از آنها، اطلاعاتی را درباره دقت درموسکوپی در بیماران in‐person به همراه معاینه بصری ضایعه پوستی فراهم کرده بودند، ۶۰ مطالعه دیگر اطلاعاتی درباره تصاویر درموسکوپی دربرداشتند، بدون اینکه بیمار حضور داشته باشد.
مطالعات مربوط به ۲۶ بیمار in‐person دادههای کاملا مرتبطی را برای استفاده از درموسکوپی در عمل فراهم کرده بودند که نتایج آنها در اینجا خلاصه شده است. در مجموع ۲۳,۱۶۹ ضایعه مشکوک پوستی در ۲۶ مطالعه وجود داشت که ۱۳ تا از آنها اطلاعاتی را درباره دقت معاینه بصری ضایعه بدون استفاده از درموسکوپی دربرداشتند. نتایج نشان دهنده این است که درموسکوپی دقیقتر از معاینه بصری به تنهایی است، هر دو برای شناسایی ملانوما بهطور صحیح به کار میروند و ضایعاتی را که ملانوما نیستند کنار میگذارند.
این مطالعات از روشهای متفاوتی برای تصمیمگیری درباره ملانوما بودن ضایعه یا نبودن آن استفاده کردهاند، این نکته بدین معنی است که ما نمیتوانیم واقعا مطمئن باشیم که درموسکوپی در مقایسه با معاینه بصری تنها چه مقدار بهتر است. اما میتوانیم مثالهای روشنی ارائه دهیم که تاثیر قابل انتظار افزایش دقت درموسکوپی را در بهکارگیری برای ۱۰۰۰ ضایعه که ۱۲۰ مورد (%۱۲) آنها ملانوما هستند، نشان دهند. برای نشان دادن اینکه درموسکوپی در مقایسه با دیدن پوست برای شناسایی ملانوما چه مقدار بهتر است، ابتدا ارزیابی کردیم که هر دو روش چه تعداد یکسان را از ضایعات بهطور کاذب ملانوما تشخیص دادهاند (ما ارزیابی کردیم که ۱۷۶ مورد از ۸۸۰ ضایعه بدون ملانوما، تشخیص نادرست ملانوما داشتند). در این موقعیت ثابت اضافه کردن درموسکوپی به معاینه بصری بهطور صحیحی ۱۹ ملانومای اضافی را شناسایی کرد (۱۱۰ در مقایسه با ۹۱) که توسط معاینه بصری تنها تشخیص داده نشده بود. به عبارت دیگر ملانوماهای بیشتر بهطور درستی شناسایی شدند.
برای اینکه بفهمیم درموسکوپی در مقایسه با دیدن پوست به تنهایی، در تشخیص ملانوما بودن یک ضایعه چه مقدار بهتر است، باید ارزیابی کنیم که هر دو تعداد یکسانی را از ضایعات بهطور صحیح ملانوما تشخیص دادهاند (۹۶ مورد از ۱۲۰ ملانوما). در این موقعیت اضافه کردن درموسکوپی به معاینه بصری تعداد ضایعاتی را که بهطور غلط ملانوما تشخیص داده شده بود تا ۱۷۶ مورد کاهش داد (کاهش از ۲۲۰ ضایعه در معاینه بصری تا ۴۴ ضایعه در گروه درموسکوپی). به عبارت دیگر ضایعاتی که ملانوما نبودند بهطور صحیحی شناسایی شده بود و افراد کمتری برای جراحی فرستاده شدند.
مقدار و ارزش چک لیستهای معاینه بصری و تاثیر ناظر متبحر
شواهدی وجود ندارد مبنی بر اینکه استفاده از چکلیست برای کمک به تفسیر درموسکوپی دقت تشخیص را تغییر میدهد یا خیر. زمانی که درموسکوپی توسط افرادی آموزش دیده و با تبحر بالینی بیشتر انجام شده بود، دقت تشخیص بهتر بود (با تعداد کمتری از عدم تشخیص ملانوما و تعداد کمتر از افرادی که برای جراحی غیر‐ضروری فرستاده شدند).
نتایج مطالعات این مرور چقدر قابل اعتماد است؟
تشخیص ملانوما با بیوپسی داده شد و عدم وجود ملانوما در اکثر مطالعات وارد شده با بیوپسی تایید شد، همچنین با پیگیری در طول زمان مطمئن شدیم که تشخیص منفی ملانوما پایدار بود یا خیر، هر دو روش احتمالا روشهای قابل اعتمادی برای تصمیمگیری درباره ملانوما بودن یک ضایعه هستند. در مطالعات اندکی فقدان ملانوما توسط متخصص ماهر تشخیص داده شد که احتمالا روش قابل اعتمادی برای تصمیمگیری در مورد اینکه بیماران واقعا ملانوما دارند یا خیر، نیست. گزارشهای ضعیف مطالعات انجام شده، ارزیابی قابلیت اطمینان مطالعات را مشکل میسازد. خصوصا استخدام گزینشی شرکتکنندگان و فقدان جزئیات مربوط به آستانه تصمیمگیری درباره نتیجه تست مثبت مشکلساز بودند.
نتایج این مرور برای چه کسانی کاربرد دارد؟
شصتوشش مطالعه در اروپا (۷۷%) و باقی مطالعات در آمریکای شمالی (۶ مطالعه)، آسیا (۴ مطالعه)، اقیانوسیه (۴ مطالعه) انجام شده بودند یا چند‐مرکزی (۷ مطالعه) بودند. میانگین سنی بیماران بین ۳۰ تا ۵۸ سال بود (در ۲۶ مطالعه گزارش شده بود). درصد افراد مبتلا به ملانوما بین ۱% تا ۴۱% برای مطالعات مربوط به درموسکوپی in‐person (میانه ۱۲%) و بین ۳% تا ۶۱% در مطالعات مربوط به استفاده از تصویرهای درموسکوپیک (میانه ۲۴%) بود. تقریبا همه مطالعات، به جای مراکز مراقبت اولیه، در مراکز ارجاعی انجام شده بودند. در اکثر مطالعات ضایعات احتمالا نمایش دهنده طیفی از ضایعاتی که در عمل دیده میشوند، نبودند، مثلا فقط ضایعاتی با اندازه خاص یا با ظاهر مشخص وارد شده بودند. علاوه بر تبحر متفاوت متخصصان بالینیی که معاینه بصری را انجام میدادند، تعاریف متفاوت استفاده شده برای تست مثبت درموسکوپی باعث شده که مشخص نباشد درموسکوپی چگونه و با چه سطح تبحر بالینی باید انجام شود تا دقت تشخیصی بالا برود.
کاربردهای این مرور چه هستند؟
درموسکوپی انجام شده توسط متخصصان در مقایسه با معاینه با چشم غیر‐مسلح در تشخیص ملانوما برای ضایعات مشکوک پوستی بهتر است. تفسیر درموسکوپی در هنگام حضور بیمار در مقایسه با تفسیر تصویرهای درموسکوپیک بدون حضور بیمار، دقیقتر هستند. درموسکوپی ممکن است به پزشکان عمومی برای شناسایی درست افراد مبتلا به ضایعات مشکوک پوستی و ارجاع آنها به متخصص کمک کند. چکلیستها برای تفسیر درموسکوپی ممکن است دقت تشخیص را در افرادی که تبحر کمتری دارند بهبود بخشد. مطالعات بیشتر با گزارشهای خوب برای ارزیابی دقت تشخیصی درموسکوپی در مراکز مراقبتهای اولیه و برای شناسایی بهترین روش ارائه اموزش درموسکوپی نیاز است.
این مرور تا چه زمانی بهروز است؟
نویسندگان این مرور به جستوجو و استفاده از مطالعاتی پرداختند که تا آگوست ۲۰۱۶ منتشر شده بود.
*در این مطالعات بیوپسی، پیگیری بالینی یا تشخیص متخصصان بالینی استانداردهای مرجع (ابزار تثبیت تشخیص نهایی) بودند.
این مرور، گزارشی از دو کوهورت از ضایعات است که در دو مطالعه منتشر شده بودند. هر دو مطالعه در معرض خطر بالای سوگیری (bias) در زمینه استخدام گزینشی شرکتکنندگان و نرخ بالای تصویرهای غیر‐ارزیابی شده بود. به دلیل انتخاب ضایعاتی که از قبل برای برداشتن در یک مرکز بالینی درماتولوژی گزینش شده بودند و همچنین تهیه تصویر توسط پزشکان به جای کاربران کارافزار گوشی همراه، نگرانی درباره قابلیت کاربرد یافتهها را بالا برده است.
ما دادهها را برای پنج کارافزار موبایل و ۳۳۲ ضایعات مشکوک پوستی با ۸۶ ملانوما در دو مطالعه گزارش کردیم. چهار کارافزار مبتنی بر هوش مصنوعی، تصاویر ضایعات (photographs) را به عنوان ملانوما (یک کارافزار) یا به عنوان خطر بالا یا ضایعات «مشکلساز» (problematic) (سه کارافزار) طبقهبندی کرده بودند، این کارافزارها بر اساس یک الگوریتم از پیش برنامهریزی شده بوده و طیف حساسیتها از ۷%؛ (۹۵% CI؛ ۲% تا ۱۶%) تا ۷۳%؛ (۹۵% CI؛ ۵۲% تا ۸۸%) و ویژگی از ۳۷%؛ (۹۵% CI؛ ۲۹% تا ۴۶%) تا ۹۴%؛ (۹۵% CI؛ ۸۷% تا ۹۷%) متغیر بودند. تنها کارافزاری که از مرور ذخیره و ارسال (store‐and‐forward review) تصاویر ضایعات توسط یک درماتولوژیست استفاده میکرد، حساسیت ۹۸%؛ (۹۵% CI؛ ۹۰% تا ۱۰۰%) و ویژگی ۳۰%؛ (۹۵% CI؛ ۲۲% تا ۴۰%) داشت.
تعداد عدم موفقیت تست (تجزیهوتحلیل تصویرهای ضایعات به وسیله کارافزارها و طبقهبندی شده به عنوان «غیر‐قابل ارزیابی» که توسط نویسندگان مطالعه کنار گذاشته شده بود) بین ۳ تا ۳۱ (یا ۲% تا ۱۸% ضایعات تجزیهوتحلیل شده) بود. کارافزارهای ذخیره و ارسال بیشترین میزان عدم موفقیت تست را داشتند (۱۵%). دستکم یک ملانوما در ارزیابیهای سه تا از چهار کارافزار به عنوان غیر‐قابل ارزیابی طبقهبندی شدند.
هدف از انجام این مرور چیست؟
ما میخواستیم دریابیم که چگونه کارافزارهای گوشیهای هوشمند میتوانند به فهم افراد (فهم عمومی ‐ general public understand) کمک کنند تا دریابند که ضایعات پوستی آنها ملانوما (melanoma) هست یا خیر.
چرا بهبود تشخیص ملانومای بدخیم سرطان پوست مهم است؟
ملانوما یکی از خطرناکترین اشکال سرطان پوست است. عدم تشخیص ملانوما (نتیجه تست منفی‐کاذب) میتواند موجب تاخیر در جراحی و مشاوره مناسب (appropriate advice) برای بهبود بیماری شود. این نکته خطر پخش سرطان را به ارگانهای دیگر بدن افزایش میدهد و احتمال مرگومیر را بالا میبرد. تشخیص یک ضایعه پوستی به عنوان ملانوما، وقتی که واقعا ملانوما نیست، (نتیجه مثبت کاذب) ممکن است موجب نگرانی و اضطراب، جراحی غیر‐ضروری و بررسیهای بیشتر شود.
در این مرور چه موضوعی بررسی شد؟
کارافزارهای تخصصی («اپها (apps)») که مشاورهای را برای ضایعات پوستی یا مولها فراهم میکنند، به طور وسیعی در گوشیهای هوشمند قابل دسترس هستند و ممکن است موجب نگرانی افراد شوند. برخی اپها به افراد اجازه میدهند تا از ضایعه پوستی خودشان که درباره آن نگران هستند، عکس بگیرند و سپس به دنبال این باشند که آیا مشاوره پزشکی بگیرند یا خیر. اپها ممکن است به طور اتوماتیک ضایعات را به مثابه خطر بالا یا پائین طبقهبندی کنند، در حالی که اپهای دیگر میتوانند به صورت ذخیره و ارسال عمل کنند، به نحوی که تصاویر به یک فرد متخصص و با تجربه ‐ مثلا یک درماتولوژیست ‐ فرستاده میشود، این شخص میتواند بر اساس عکس فرستاده شده، ارزیابی خطر را انجام دهد. محققین کاکرین دو مطالعه را یافتند، آنها با بررسی پنج اپ که تصاویر را به طور اتوماتیک تجزیهوتحلیل میکردند و یک اپ دیگر که از رویکرد ذخیره و ارسال استفاده میکرد، ضایعات مشکوک پوستی را ارزیابی کردند.
نتایج اصلی این مرور چه هستند؟
این مرور شامل دو مطالعه با ۳۳۲ ضایعه، از جمله ۸۶ ملانوما بود که حداقل توسط یک کارافزار گوشی هوشمند تجزیهوتحلیل شده بود. در هر دو مطالعه از تصاویر مولها یا ضایعات پوستی استفاده شده بود که به دلیل اینکه پزشکان از قبل بر این تصمیم بودند که آنها ملانوما هستند، قرار بود برداشته شوند. به جای اینکه افراد از ضایعاتشان عکس بگیرند، عکسها توسط پزشکان گرفته شده بودند. بدین دلایل ما قادر نبودیم تخمین قابل اعتمادی درباره چگونگی کاربرد اپها داشته باشیم.
چون اپهایی که بر اساس عکسهای گرفته شده از گوشی هوشمند، ارزیابی سریعی (اتوماتیک) از ضایعه پوستی یا مول داشتند، ۷ تا ۵۵ مورد ملانوما را تشخیص نداده بودند.
یک اپ که عکسهای مول یا ضایعه پوستی را برای ارزیابی به درماتولوژیست فرستاده بود، فقط یک مورد ملانوما را تشخیص نداده بود. ۶ مورد ملانومای دیگر که توسط درماتولوژیست بررسی شده بودند به عنوان خطر بالا طبقهبندی نشده بودند اما در عوض درماتولوژیست قادر نبود ضایعه را آتیپیکال (احتمالا ملانوما) یا تیپیکال (قطعا ملانوما نیست) طبقهبندی کند.
نتایج مطالعات این مرور چقدر قابل اعتماد است؟
تعداد اندک و کیفیت ضعیف مطالعات وارد شده قابلیت اطمینان یافتهها را کاهش میداد. افراد وارد شده کسانی نبودند که به طور معمول در زندگیشان از کارافزار استفاده کنند. تشخیص نهایی ملانوما توسط بافتشناسی تایید شده بود و این احتمالا روش قابل اعتمادی است برای تصمیمگیری در مورد اینکه بیمار واقعا ملانوما دارد یا خیر. با این حال مطالعات ۲% تا ۱۸% تصویرها را کنار گذاشتند چون کارافزار نمیتوانست هیچ توصیهای در این زمینه داشته باشد.
نتایج این مرور برای چه کسانی کاربرد دارد؟
مطالعات در ایالات متحده و آلمان انجام شده بودند. در این مطالعات نکات کلیدی بیمار مانند سن و جنسیت گزارش نشده بودند. درصد افرادی که با تشخیص نهایی ملانوما مشخص شده بودند ۱۸% و ۳۵% بودند و این بیشتر از آن چیزی بود که در جامعه دیده میشود. بیماران واجد شرایط در مقایسه با کاربران کارافزار محدود بودند. عکسها به جای گوشی هوشمند، توسط پزشکان گرفته شده و این موضوع به طور جدی قابلیت کاربرد نتایج را تحت تاثیر قرار میدهد.
کاربردهای این مرور چه هستند؟
کارافزارهای رایج گوشیهای هوشمند که از تجزیهوتحلیل اتوماتیک استفاده میکنند شانس بالایی در عدم تشخیص ملانوما دارند (منفی کاذب). کارافزارهای ذخیره و ارسال تصاویر نقش بالقوه در شناسایی افرادی دارند که ضایعات بالقوه بدخیم دارند و دلیل آن این است که باعث درگیر شدن سریع افراد مشکوک به ضایعات پوستی میشود، با این حال آنها کاربردی برای منابع و حجم کاری دارند (resource and workload implications).
ارتقای کارافزارها برای کمک به شناسایی افرادی که ممکن است ملانوما داشته باشند، حوزهای است که به سرعت رشد و گسترش دارد. وجود کارافزارهای جدید، با کیفیت بالا و بهتر میتوانند نتیجهگیریهای این مرور را به طور اساسی تغییر دهند.
این مرور تا چه زمانی بهروز است؟
نویسندگان این مرور به جستوجو و استفاده از مطالعاتی پرداختند که تا آگوست ۲۰۱۶ منتشر شده بود.
*در این مطالعات بیوپسی استاندارد مرجع (ابزار تثبیت تشخیص نهایی) بود.
یک نویسنده مرور ویژگیهای مطالعه را استخراج، و نویسنده دوم دادههای استخراج شده را کنترل کرد. برای ارزیابی خطر سوگیری (bias) از یک نسخه مناسب از ابزار کیفیت در مطالعات پیشآگهی (Quality In Prognosis Studies; QUIPS) استفاده کردیم. بروز و میزان نسبی بروز (incidence rate ratios; IRR) را با استفاده از یک مدل اثرات تصادفی برای محاسبه ناهمگونی بین مطالعه ترکیب کردیم. برای متاآنالیز دادههای مربوط به بروز، از روشی برای ترکیب نسبتها استفاده کردیم. برای نسبت خطر (HR) و نسبت شانس (OR) وضعیت IH در مقابل نورموگلیسمی، که با ۹۵% فاصله اطمینان (CI) گزارش شدند، خطاهای استاندارد را از این CIها به دست آوردیم و متاآنالیزهای اثرات تصادفی را با استفاده از روش واریانس معکوس عمومی (generic inverse‐variance) انجام دادیم. از HRهای چند‐متغیره و یک مدل با بیشترین تعداد متغیرهای کمکی (covariate) استفاده کردیم. قطعیت شواهد را با استفاده از یک نسخه اقتباس شده از سیستم درجهبندی توصیه، ارزیابی، توسعه و ارزشیابی (GRADE) بررسی کردیم.
ما ۱۰۳ مطالعه کوهورت آیندهنگر را وارد کردیم. این مطالعات عمدتا IH را با IFG۵,۶ (FPG؛ ۵,۶ میلیمول/لیتر تا ۶.۹ میلیمول/لیتر یا ۱۰۰ میلیگرم/دسیلیتر تا ۱۲۵ میلیگرم/دسیلیتر)؛ IFG۶,۱ (FPG؛ ۶,۱ میلیمول/لیتر تا ۶.۹ میلیمول/لیتر یا ۱۱۰ میلیگرم/دسیلیتر تا ۱۲۵ میلیگرم/دسیلیتر)؛ IGT (گلوکز پلاسما ۷.۸ میلیمول/لیتر تا ۱۱.۱ میلیمول/لیتر یا ۱۴۰ میلیگرم/دسیلیتر تا ۱۹۹ میلیگرم/دسیلیتر دو ساعت پس از اینکه ۷۵ گرم گلوکز در تست تحمل گلوکز خوراکی بارگیری شود، ترکیب IFG و IGT؛ (IGT/IFG)، و HbA۱c بالا (HbA۱c۵,۷: HbA۱c؛ ۵,۷% تا ۶.۴% یا ۳۹ میلیمول/مول تا ۴۶ میلیمول/مول؛ HbA۱c۶,۰: HbA۱c؛ ۶,۰% تا ۶.۴% یا ۴۲ میلیمول/مول تا ۴۶ میلیمول/مول) تعریف کردند. دوره پیگیری بین ۱ تا ۲۴ سال متغیر بود. نودوسه مطالعه، پیشآگهی کلی افراد مبتلا به IH را که با بروز تجمعی T۲DM اندازهگیری شد، مورد بررسی قرار دادند و ۵۲ مطالعه وضعیت قند خون را بهعنوان یک عامل پیشآگهی برای T۲DM از طریق مقایسه یک مطالعه کوهورت با شرکتکنندگان مبتلا به IH با یک مطالعه کوهورت با شرکتکنندگان نورموگلیسمی بررسی کردند. در ۴۱ مطالعه، شرکتکنندگان اصالتا اهل استرالیا، اروپا یا آمریکای شمالی بودند؛ در ۷ مطالعه، شرکتکنندگان از آمریکای لاتین؛ در ۵۰ مطالعه اهل آسیا یا خاورمیانه؛ در ۵ مطالعه ساکنان جزایر یا سرخپوستان آمریکایی بودند. شش مطالعه، کودکان و/یا نوجوانان را وارد کردند.
بروز تجمعی T۲DM مرتبط با IFG۵,۶؛ IFG۶,۱؛ IGT و ترکیب IFG/IGT با طول مدت پیگیری افزایش یافت. بروز تجمعی با IFG/IGT، پس از IGT؛ IFG۶,۱؛ IFG۵,۶ بالاتر بود. دادههای محدود بروز T۲DM مرتبط با HbA۱c۶,۰ بالاتری را در مقایسه با HbA۱c۵,۷ نشان دادند. قطعیت شواهد مربوط به پیشآگهی کلی را به دلیل عدم دقت (CIهای گسترده در اغلب مطالعات) در سطح متوسط ارزیابی کردیم. در ۴۷ مطالعه گزارش دهنده از جبران نورموگلیسمی، بازگشت طی یک تا پنج سال پیگیری، از ۳۳% تا ۵۹% و در ۶ تا ۱۱ سال پیگیری، از ۱۷% تا ۴۲% رخ داد (شواهد با قطعیت متوسط).
مطالعات ارزیابی کننده تاثیر پیشآگهی در مورد IH در مقابل نورموگلیسمی، معیارهای اثر متفاوتی را گزارش کردند (HRs؛ IRRs و ORs). بهطور کلی، همه معیارهای اثر نشان دهنده افزایش خطر T۲DM در ۱ تا ۲۴ سال پیگیری بود. با توجه به پیگیری طولانیمدت مطالعات کوهورت، به نظر میرسد که ارزیابی HRs برای عوارض وابسته به زمان مانند بروز T۲DM قابل اعتماد باشد. HR ترکیبی و تعداد مطالعات و شرکتکنندگان در تعاریف مختلف IH در مقایسه با نورموگلیسمی عبارت بودند از: IFG۵,۶: HR؛ ۴,۳۲ (۹۵% CI؛ ۲.۶۱ تا ۷.۱۲)؛ ۸ مطالعه، ۹۰۱۷ شرکتکننده؛ IFG۶,۱؛ HR؛ ۵,۴۷ (۹۵% CI؛ ۳.۵۰ تا ۸.۵۴)؛ ۹ مطالعه، ۲۸۱۸ شرکتکننده؛ IGT: HR؛ ۳.۶۱ (۹۵% CI؛ ۲.۳۱ تا ۵.۶۴)؛ ۵ مطالعه، ۴۰۱۰ شرکتکننده؛ IFG و IGT؛ HR؛ ۶.۹۰ (۹۵% CI؛ ۴.۱۵ تا ۱۱.۴۵)؛ ۵ مطالعه، ۱۰۳۸ شرکتکننده؛ HbA۱c۵,۷؛ HR؛ ۵,۵۵ (۹۵% CI؛ ۲.۷۷ تا ۱۱.۱۲)؛ ۴ مطالعه، ۵۲۲۳ شرکتکننده؛ HbA۱c۶,۰؛ HR؛ ۱۰,۱۰ (۹۵% CI؛ ۳.۵۹ تا ۲۸.۴۳)؛ ۶ مطالعه، ۴۵۳۲ شرکتکننده. در تجزیهوتحلیل زیرگروه، هیچ الگوی مشخصی از تفاوتها بین مناطق جغرافیایی دیده نشد. ما شواهد مربوط به اثر پیشآگهی را در مورد IH در مقابل نورموگلیسمی، به دلیل محدودیتهای مطالعه به شواهدی با قطعیت پائین کاهش دادیم، زیرا بسیاری از مطالعات برای عوامل مخدوش کننده به اندازه کافی تعدیل نشده بودند. عدم دقت و ناهمگونی، به ترتیب، به دلیل ۹۵% CI گسترده و ۹۵% فواصل پیشبینی گسترده، منجر به کاهش بیشتری شدند (گاهی اوقات از عوامل پیشآگهی منفی تا مثبت برای ارتباط با پیامد).
این شواهد تا ۲۶ فوریه ۲۰۱۸ بهروز است.
سوال مطالعه مروری
ما میخواستیم بدانیم که سطح بالای قند خون («پرهدیابت» (prediabetes))، خطر ابتلا به دیابت نوع ۲ را افزایش میدهد یا خیر و اینکه چه تعداد از این افراد به سطح نرمال قند خون (نورموگلیسمی (normoglycaemia)) باز میگردند. ما همچنین تفاوت را در ابتلا به دیابت نوع ۲ در افراد مبتلا به پرهدیابت در مقایسه با افراد نورموگلیسمی بررسی کردیم.
پیشینه
دیابت نوع ۲ اغلب با اندازهگیریهای قند خون مانند اندازهگیری گلوکز خون ناشتا یا گلوکز پس از تست تحمل گلوکز خوراکی (نوشیدن ۷۵ گرم گلوکز با معده خالی) یا با اندازهگیری هموگلوبین گلیکوزیله شده A۱c؛ (HbA۱c)، که یک نشانگر طولانیمدت از سطوح گلوکز خون است، تشخیص داده میشود. دیابت نوع ۲ ممکن است اثرات بدی بر سلامت در طولانیمدت داشته باشد (عوارض دیابتی)، مانند بیماری شدید چشمی یا کلیوی یا پای دیابتی، و در نهایت منجر به زخمهای پا شود.
سطوح بالای گلوکز خون (هیپرگلیسمی)، که بالاتر از حد نرمال اما کمتر از حد تشخیص دیابت نوع ۲ هستند، نشاندهنده پرهدیابت یا هیپرگلیسمی با شدت متوسط است. روش تعریف پرهدیابت، تاثیرات مهمی بر سلامت عمومی دارد، زیرا بعضی از پزشکان، افراد مبتلا به پرهدیابت را با داروهایی که میتوانند مضر باشند، درمان میکنند. بهعنوان مثال، کاهش آستانه برای تعیین اختلال گلوکز ناشتا (بعد از غذا نخوردن به مدت یک شب یا ناشتا بودن) از ۶,۱ میلیمول/لیتر یا ۱۱۰ میلیگرم/دسیلیتر تا ۵.۶ میلیمول/لیتر یا ۱۰۰ میلیگرم/دسیلیتر، که توسط انجمن دیابت آمریکا (American Diabetes Association; ADA) انجام شد، بهطور چشمگیری تعداد افراد را با تشخیص پرهدیابت در سراسر جهان افزایش داد.
ویژگیهای مطالعه
ما به دنبال مطالعات مشاهدهای بودیم (مطالعاتی که بدون مداخله صورت میگیرند اما افراد در طول دورههای طولانی پیگیری میشوند) که بررسی کردند چه تعداد از افراد مبتلا به پرهدیابت در ابتدای مطالعه، در نهایت مبتلا به دیابت نوع ۲ میشوند. ما همچنین مطالعاتی را بررسی کردیم که به مقایسه افراد مبتلا به پرهدیابت با افراد نورموگلیسمی پرداختند. پرهدیابت بر اساس اندازهگیریهای مختلف گلوکز خون تعریف شد.
ما ۱۰۳ مطالعه را یافتیم، که به مانیتورینگ افراد، بیشتر از ۱ تا ۲۴ سال پرداختند. بیش از ۲۵۰,۰۰۰ شرکتکننده مطالعات را آغاز کردند. در ۴۱ مطالعه، شرکتکنندگان اهل استرالیا، اروپا یا آمریکای شمالی بودند، در ۷ مطالعه شرکتکنندگان عمدتا اهل آمریکای لاتین، و در ۵۰ مطالعه شرکتکنندگان اهل آسیا یا خاورمیانه بودند. شرکتکنندگان سه مطالعه، سرخپوستان آمریکایی بودند و یک مطالعه از افراد جمهوری موریس و نائورو (Mauritius and Nauru) دعوت کرد. شش مطالعه، کودکان، نوجوانان یا هر دو را بهعنوان شرکتکننده وارد کردند.
این شواهد تا ۲۶ فوریه ۲۰۱۸ بهروز است.
نتایج کلیدی
بهطور کلی، ابتلا به دیابت نوع ۲ جدید (بروز دیابت) در افراد مبتلا به پرهدیابت در طول زمان افزایش یافت. با این حال، بسیاری از شرکتکنندگان نیز از وضعیت پرهدیابت به سطوح نرمال گلوکز خون بازگشتند. در مقایسه با افراد نورموگلیسمی، افراد مبتلا به پرهدیابت (با هر تعریفی) افزایش خطر ابتلا را به دیابت نوع ۲ نشان دادند، اما نتایج حاکی از آن بودند که در این رابطه تفاوتهای زیادی وجود داشته و به شیوه اندازهگیری پرهدیابت بستگی دارد. تفاوتهای شفافی بین مناطق مختلف جهان یا جمعیتهای مختلف وجود نداشت. از آنجا که افراد مبتلا به پرهدیابت ممکن است به دیابت مبتلا شوند اما میتوانند تقریبا در هر زمانی نیز به حالت نورموگلیسمی بازگردند، پزشکان باید در مورد درمان پرهدیابت مراقب باشند، زیرا مطمئن نیستیم که این درمان، منجر به منفعت بیشتری نسبت به آسیب آن خواهد شد یا خیر، بهخصوص اگر در مقیاس جهانی، که بسیاری از افراد را در سراسر جهان تحت تاثیر قرار میدهد، انجام میشود.
قطعیت شواهد
قطعیت شواهد مربوط به پیشآگهی کلی متوسط بود زیرا نتایج بهطور گستردهای متفاوت بودند. قطعیت شواهد مربوط به مطالعاتی که به مقایسه افراد مبتلا به پرهدیابت با افراد نورموگلیسمی پرداختند، پائین بود زیرا نتایج دقیق نبوده و بهطور گستردهای متغیر بودند. در مطالعات مشاهدهای وارد شده، محققان اغلب این موضوع را بهاندازه کافی بررسی نکردند که عواملی مانند عدم فعالیت فیزیکی، سن یا افزایش وزن بدن نیز، ابتلا را به دیابت نوع ۲ تحت تأثیر قرار میدهند یا خیر، در نتیجه ارتباط بین پرهدیابت و ابتلا به دیابت نوع ۲ کمتر شفاف است.
مردهزایی سالانه ۲,۶ میلیون بارداری را در سراسر جهان تحت تأثیر قرار میدهد. در حالی که اکثر موارد در کشورهایی با سطح درآمد پائین و متوسط اتفاق میافتد، مردهزایی همچنان یک مساله بالینی مهم برای کشورهایی با درآمد بالا (high‐income countries; HICs) است ‐ انگلیس و ایالات متحده آمریکا نرخ بالاتر از میانگین را برای HIC گزارش میدهند. در HIC، بیشترین ارتباطی که با مردهزایی گزارش میشود، اختلال عملکرد جفت است. اختلال عملکرد جفت از نظر بالینی به صورت محدودیت رشد جنین (fetal growth restriction; FGR) و نوزادان کوچک برای سن بارداری مشهود است. این وضعیت میتواند ناشی از قطع جفت یا اختلالات ناشی از فشار خون بالا در بارداری و بسیاری از اختلالات و عوامل دیگر باشد.
ناهنجاریهای جفتی در ۱۱% تا ۶۵% موارد مردهزایی مشاهده میشود. تشخیص FGR در رحم دشوار است. کوچک بودن برای سن بارداری (small‐for‐gestational age; SGA)، که پس از تولد ارزیابی میشود، متداولترین معیار جانشین برای این پیامد است. درجه SGA با احتمال FGR مرتبط است؛ ۳۰% از نوزادان با وزن تولد < صدک ۱۰ به نظر میرسد FGR باشند، در حالی که ۷۰% از نوزادان با وزن هنگام تولد < صدک ۳، FGR هستند. SGA مهمترین عامل خطر پیش از زایمان برای نوزادی است که مرده به دنیا خواهد آمد. شناسایی صحیح نوزادان SGA با کاهش نرخ مورتالیتی پیش از زایمان همراه است. با این حال، تستهایی که در حال حاضر استفاده میشود، مانند اندازهگیری طول سمفیز‐فوندال (symphysis‐fundal)، حساسیت و ویژگی پائینی برای شناسایی نوزادان SGA دارند.
ما ۹۱ مطالعه را وارد کردیم که هفت تست را ارزیابی کردند ‐ تستهای خون برای لاکتوژن جفتی انسانی (human placental lactogen; hPL)، استریول (oestriol)، فاکتور رشد جفتی (placental growth factor; PlGF) و اسید اوریک، اولتراسوند EFW و درجهبندی جفت و استریول ادرار ‐ در مجموع ۱۷۵,۴۲۶ زن باردار، که از این تعداد ۱۵,۴۷۱ بارداری منجر به تولد نوزاد کوچک و ۷۴۰ بارداری به مردهزایی ختم شد. مطالعات وارد شده در اکثر حوزهها در معرض خطر پائین سوگیری (bias) قرار داشتند، اگرچه ۵۹% از مطالعات در معرض خطر نامشخص سوگیری برای دامنه استاندارد مرجع بودند. در پنجاهوسه درصد از مطالعات، به دلیل ورود فقط زنانی با خطر بالا یا خطر پائین، نگرانیهای بالایی در مورد قابلیت کاربرد مطالعات وجود داشت.
با استفاده از تمام دادههای موجود برای SGA (۸۶ مطالعه؛ ۱۵۹,۴۹۰ بارداری شامل ۱۵,۴۷۱ نوزاد SGA)، شواهدی از تفاوت در دقت (P < ۰,۰۰۰۱) بین هفت تست برای تشخیص بارداریهایی وجود داشت که SGA هنگام تولد هستند. اولتراسوند EFW دقیقترین تست برای تشخیص SGA در بدو تولد با نسبت شانس تشخیصی (diagnostic odds ratio; DOR) معادل ۲۱.۳ (۹۵% CI؛ ۱۳.۱ تا ۳۴.۶) بود؛ hPL دقیقترین تست بیوشیمیایی با DOR معادل ۴.۷۸ (۹۵% CI؛ ۳.۲۱ تا ۷.۱۳) گزارش شد. در یک کوهورت فرضی از ۱۰۰۰ زن باردار، در میانه ویژگی برابر با ۰.۸۸ و میانه شیوع معادل ۱۹%، EFW؛ hPL، استریول، استریول ادرار، اسید اوریک، PlGF و درجهبندی جفت، به ترتیب ۵۰ (۹۵% CI؛ ۳۲ تا ۶۸)، ۱۱۶ (۹۷ تا ۱۳۳)، ۱۲۴ (۱۰۸ تا ۱۳۷)، ۱۲۷ (۹۵ تا ۱۵۲)، ۱۳۹ (۱۱۸ تا ۱۵۴)، ۱۴۴ (۱۱۸ تا ۱۶۱) و ۱۴۴ (۱۲۲ تا ۱۶۱) نوزاد SGA را از دست میدهند. برای تشخیص بارداریهای منتهی به مردهزایی (۲۱ مطالعه؛ ۱۰۰,۶۸۷ بارداری شامل ۷۴۰ مورد مردهزایی)، در مقایسه غیر‐مستقیم چهار تست بیوشیمیایی، PlGF با DOR معادل ۴۹.۲ (۹۵% CI؛ ۱۲.۷ تا ۱۹۱) دقیقترین تست بود. در یک گروه فرضی از ۱۰۰۰ زن باردار، در میانه ویژگی برابر با ۰.۷۸ و میانه شیوع معادل ۱.۷%، PlGF؛ hPL، استریول ادرار و اسید اوریک، به ترتیب ۲ (۹۵% CI؛ ۰ تا ۴)، ۴ (۲ تا ۸)، ۶ (۶ تا ۷) و ۸ (۳ تا ۱۳) مورد مردهزایی را از دست میدهند. هیچ مطالعهای دقت اولتراسوند EFW را برای تشخیص بارداری منتهی به مردهزایی ارزیابی نکرد.
پیشینه
اختلال عملکرد جفت وضعیتی را توصیف میکند که جفت پاسخگوی خواستههای کودک در حال رشد نیست؛ این وضعیت ممکن است منجر به تولد نوزادی شود که کوچکتر از حد انتظار بوده یا مرده متولد میشوند. در حال حاضر، تشخیص اختلال عملکرد جفت پیش از تولد آسان نیست؛ از اسکن اولتراسوند اغلب برای شناسایی نوزادان کوچک استفاده میشود. با این حال، تستها میتوانند موادی را اندازهگیری کنند که توسط جفت در خون و ادرار مادران وارد شده و ممکن است جفتی را که عملکرد خوبی ندارد، تشخیص دهند. هدف ما یافتن بهترین تست برای شناسایی اختلال عملکرد جفت بود.
آنچه ما انجام دادیم
در اکتبر ۲۰۱۶ به جستوجوی مطالعات پرداخته و در مجموع ۲۴,۰۵۹ مطالعه را شناسایی کردیم ‐ ۹۱ مورد از این مطالعات اطلاعاتی را در اختیار ما قرار دادند که توانستیم در این مرور وارد کنیم. اسکن اولتراسوند و شش تست مختلف را از مواد جفت، از جمله پروتئینها و هورمونها، بررسی کردیم. این مطالعات شامل ۱۷۵,۴۲۶ زن بودند که در مجموع به ۱۵,۴۷۱ بارداری منجر به تولد نوزاد کوچک و ۷۴۰ بارداری منجر به مردهزایی منتهی شدند.
آنچه ما یافتیم
از ۹۱ مطالعه وارد شده، ۸۶ مورد اطلاعاتی را در مورد نوزادان کوچک داشتند، که از این تعداد ۱۸ مورد به مردهزایی نیز پرداختند؛ پنج مطالعه دیگر فقط در مورد مردهزایی به بررسی پرداختند. دقیقترین آزمایش برای تشخیص نوزاد کوچک، اولتراسوند برای تخمین وزن کودک بود. از میان مواد اندازهگیری شده در خون مادر، لاکتوژن جفتی انسانی (human placental lactogen; hPL)، هورمونی که توسط جفت در دوران بارداری تولید میشود، دقیقترین بود. فقط یک مطالعه وجود داشت که هم اسکن اولتراسوند و هم اندازهگیری یک ماده جفتی را بررسی کرد. فاکتور رشد جفت (placental growth factor; PlGF) دقیقترین تست یک ماده جفتی برای شناسایی نوزادی است که مرده به دنیا میآید؛ هیچ مطالعهای در زمینه اسکن اولتراسوند برای تشخیص نوزادی که مرده به دنیا خواهد آمد، وجود نداشت. تستهای مواد جفتی برای شناسایی نوزاد در معرض خطر مرده به دنیا آمدن، بهتر از تشخیص کودک کوچک بود.
سایر اطلاعات مهم قابل بررسی
اغلب مطالعات وارد شده در این مرور بین ۱۹۷۴ و ۲۰۱۶ انجام شدند. مطالعات مربوط به مواد جفتی اغلب پیش از سال ۱۹۹۱ و پس از سال ۲۰۱۳ انجام شدند؛ مطالعات اولیه ممکن است تحولات فناوری تست را منعکس نکنند. برای بررسی اینکه ترکیبی از اسکن اولتراسوند و تستهای خون مادر میتوانند در شناسایی بارداریهایی موثر باشند که به تولد یک نوزاد کوچک یا یک نوزاد مرده ختم میشوند، لازم است مطالعات بیشتری انجام شوند. هیچ مطالعهای برای این مرور شناسایی نشد که دقت اولتراسوند و آزمایش خون را در کنار هم بررسی کرده باشد.
صفحه ۱ از ۱ |
کلیه حقوق این وب سایت متعلق به مرکز همکار کاکرین ایران می باشد.
طراحی و برنامه نویسی : یکتاوب افزار شرق
© 2025 CC BY-NC 4.0 | Cochrane Iran Associate Centre
Designed & Developed by : Yektaweb