فرض کنین رفتین دکتر و چند تا آزمایش دادین. دکتر تشخیص میده که کلسترول شما بالاست و بهتره دارو مصرف کنید. پس یک بسته قرص می گیرید. تا حدودی مطمئن هستید، پزشک شما تا حدودی مطمئنه که این دارو اثر خواهد کرد. شرکتی که اون دارو رو اختراع کرده مطالعات زیادی انجام داده و به اف دی ای (سازمان غذا و دارو) ارائه کرده. اونها به دقت و وسواس بررسی و تأییدش کردن. اونها جزئیات نحوه ی تأثیر اونو میدونن، اونها جزئیات عوارض جانبی اونو میدونن. باید درست باشه. کمی بیشتر با پزشکتان حرف میزنید و پزشکتان کمی نگرانه چون شما افسرده شدین، سر حال نیستین، مثل سابق از زندگی لذت نمیبرین. پزشک شما میگه، «ببینید، فکر کنم افسرده شدی.یک قرص دیگه به شما میدم.»
پس حالا داریم درباره دو تا دارو صحبت میکنیم. این قرص هم-- میلیونها نفر اونو مصرف کردن، شرکت مطالعاتی انجام داده، اف دی ای اونو بررسی کرده-- همه چیز خوبه. فکر میکنید همه چیز درسته. فکر می کنید همه چیز درسته. خوب، یک دقیقه صبر کنید. چقدر این دو دارو رو با هم مطالعه کردیم؟
خوب، انجام این کار خیلی سخته. در واقع این کار مرسوم نیست. این کاملاً وابسته به چیزیه که ما بهش میگیم «نظارت پس از فروش،» بعد از ورود دارو به بازار. چطور میشه فهمید اتفاق بدی افتاده بین دو دارو؟ سه؟ پنج؟ هفت؟ از هر کس که چند تا مریضی داشته باشه میخواین بپرسین چند تا دارو مصرف می کنن.
چرا این مسئله برام مهمه؟ برام خیلی مهمه. من متخصص انفورماتیک و داده شناسی هستم و به نظرم، تنها راه-- تنها راه-- فهمیدن این تداخلات استفاده از منابع متعدد و متنوع دادههاست برای این که بفهمیم مصرف هم زمان داروها کی بیخطره و کی بی خطر نیست.
پس بذارین یه قصه بگم درباره ی علم داده شناسی. این قصه با دانشجویم "نیک" شروع میشه. بذارین "نیک" صداش کنیم، چون اسمش همینه.
(خنده)
نیک یه دانشجوی جوان بود. بهش گفتم، "ببین، نیک، باید نحوه ی اثر داروها رو بدونیم و این که با هم چه اثری دارن و جدا از هم چه اثری دارن، و چیز زیادی نمیدونیم. اما اف دی ای یه پایگاه داده جالب داره. یه پایگاه داده درباره عوارض دارویی. این دادهها عیناً در اینترنت منتشر شده-- در دسترس عموم، همه همین الان میتونین دانلودش کنین-- صدها تا هزاران گزارش عوارض دارویی از بیماران، دکترها، شرکتها و داروسازها. و این گزارشها کاملاً ساده است: همه بیماریهایی که مریض داره، همه داروهایی که مصرف میکنه، و همه عوارض جانبی که تجربه کرده. این همه عوارضی نیست که امروز تو آمریکا اتفاق میفته، اما صدها و صدها تا هزاران دارو اینجا هست.
پس به نیک گفتم، «بیا به قند فکر کنیم. قند خیلی مهمه، و میدونیم که به دیابت ربط داره. بذار ببینیم چه اتفاقی برای قند میفته.» نیک مرخص شد. وقتی برگشت،
گفت، «راس، من یه نرم افزار درست کردم که عوارض جانبی داروها رو نگاه میکنه از روی این پایگاه داده، و به ما میگه این دارو ممکنه قند خون رو بالا ببره یا نه.»
موفق شد. به عبارتی خیلی ساده بود. همه داروهایی رو که ثابت شده قند رو تغییر میدن و گروهی از داروها که قند رو تغییر نمیدن با هم مقایسه کرد، و گفت، «عوارضشون چه فرقی داره؟ فرق از نظر خستگی؟ از نظر اشتها؟ از نظر اجابت مزاج؟» همه اینها دست به دست هم داد تا قدرت پیش بینی واقعاً خوبی بهش بده. گفت، «راس، میتونم با دقت ۹۳ درصد پیش بینی کنم چه موقع یه دارو قند رو تغییر میده.»
گفتم،«نیک، این عالیه.» او دانشجوی جوونیه که باید بهش اعتماد به نفس داد. « اما نیک، یه مشکل هست. این که هر پزشکی تو دنیا میدونه چه داروهایی قند رو تغییر میدن، چون این تو حرفه ی ما یه اصله. عالیه، خسته نباشی، اما نه تا اون حد، مطمئناً قابل چاپ نیست.»
(خنده)
گفت، «میدونم، راس، فکر میکردم اینو بگی.» نیک باهوشه. «فکر می کردم اینو بگی، پس یه آزمایش دیگه انجام دادم. نگاه کردم چه کسانی تو این پایگاه داده دو دارو مصرف می کنن، و دنبال پیامها هم گشتم، پیامهای تغییر قند، برای افرادی که دو دارو مصرف میکنن، که هیچ کدوم از داروها به تنهایی قند رو تغییر نمیدن، اما با هم پیام قدرتمندی دیدم.»
و گفتم، «هی! تو باهوشی. فکر خوبیه. فهرست رو بهم نشون بده.» و چند تا دارو بود، خیلی هیجان انگیز نبود. اما چیزی که توی فهرست نظر منو جلب کرد دو تا دارو بود: پاروکستین، یا پاکسیل، یه ضدافسردگی؛ و پراواستاتین، یا پراواکول، یه داروی چربی خون.
و گفتم، «هه. میلیونها آمریکایی این دو تا رو مصرف میکنن.» در واقع، بعدها متوجه شدیم، اون موقع پانزده میلیون آمریکایی پاروکستین مصرف میکردن و پانزده میلیون پراواستاتین، و حساب کردیم، یک میلیون نفر هر دو رو مصرف میکردن. خوب یعنی یک میلیون نفرممکنه یه مشکلی با قند خودشون داشته باشن اگه این مامبو جامبو (اجی مجی) که نیک با هوش مصنوعی و پایگاه دادههای اف دی ای انجام داده واقعاً کار کنه. اما گفتم، «هنوز قابل چاپ نیست، چون عاشق اون کاری هستم که با اجی مجی و هوش مصنوعی انجام دادی، اما شواهدی که داریم قطعی نیست.» باید یه کار دیگه کنیم. بیا بریم سراغ پرونده الکترونیک پزشکی استنفورد. یه نسخه ازش داریم که برای تحقیق مشکل نداره، اطلاعات هویتی رو ازش حذف کردیم. و گفتم، «بذار ببینیم افرادی که این دو تا دارو رو مصرف میکنن با قندشون مشکل دارن.»
خوب هزاران هزار نفر در پروندههای الکترونیک پزشکی استنفورد هستن که پاروکستین و پراواستاتین مصرف میکنن. اما ما مریضهای خاصی رو لازم داشتیم. مریضهایی رو لازم داشتیم که یکی از اونها رو مصرف میکرده و یه آزمایش قند داشته، بعد داروی دوم رو گرفته و یه آزمایش قند دیگه داده، همه طی یه فاصله زمانی قابل قبول-- چیزی حدود دو ماه. و وقتی این کار رو انجام دادیم، ده تا مریض پیدا کردیم.اما هشت تا از ده مریض قندشون بالا رفته بود وقنی "پی" دوم رو گرفته بودن-- بهش میگیم پی اول و پی دوم-- وقتی پی دوم رو گرفته بودن. فرقی نداشت هر کدوم اول باشه، با اضافه شدن دومی، قند بیست تا بالا رفته بود. فقط به عنوان یادآوری، اگه دیابتی نباشین، اوضاع شما عادیه با قند حدود نود. و اگه به صدوبیست، صدوبیست وپنج برسه، دکتر شما به فکر تشخیص احتمالی دیابت میفته. یعنی افزایش بیست تا-- کاملاً معنی داره.
گفتم،«نیک، خیلی عالیه. اما متأسفم، هنوز مقاله ای نداریم، چون این ده تا مریضه و-- اجازه بدین-- این مریضها کافی نیست.»
بعدش گفتیم، چه کار میتونیم بکنیم؟ و گفتیم، بیا به دوستامون در هاروارد و وندربلت زنگ بزنیم، که اونها هم-- هاروارد در بوستون، وندربلت در نشویل، که اونها هم مثل ما پرونده الکترونیک پزشکی دارن. بیا ببینیم اونها هم میتونن مریضهای مشابه پیدا کنن با پی اول، پی دوم، آزمایش قند، با نتیجهای که ما لازم داریم.
خدا عمرشون بده، وندربلت در عرض یک هفته چهل مورد پیدا کرد، با همون مشخصات. هاروارد صد تا پیدا کرد، با همون مشخصات. یعنی در نهایت صدوپنجاه تا مریض داشتیم از سه مرکز پزشکی مختلف که اون مریضها این دو تا دارو رو می گرفتن و به ما میگفتن قندشون تا حد معنی دار بالا رفته.
جالبتر این که، دیابتیها رو کنار گذاشته بودیم، چون دیابتیها خودشون قند بالا دارن. وقتی به قند دیابتیها نگاه کردیم، شصت تا بالا رفته بود، نه فقط بیست تا. موفقیت بزرگی بود، و گفتیم، «این یکی رو باید چاپ کنیم.» مقاله رو تحویل دادیم. همه ی اونها شواهد دادهای بود، دادههای اف دی ای، دادههای استنفورد، دادههای وندربلت، دادههای هاروارد. آزمایش واقعی انجام نداده بودیم.
اما نگران بودیم. در حالی که مقاله در دست بررسی بود، نیک به آزمایشگاه رفت. کسی رو پیدا کردیم که از آزمایشگاه سررشته داشت. من بلد نیستم. مریض میبینم اما کار با پیپت رو بلد نیستم. به ما گفتن به موشها دارو بدیم. موشها رو گرفتیم و بهشون پی اول، پاروکستین دادیم.به موشهای دیگه پراواستاتین دادیم. و به گروه سوم هر دو رو دادیم. و قند موشها بیست تا شصت تا بالا رفت.
یعنی مقاله فقط بر اساس شواهد دادهای پذیرفته شد، اما یه یادداشت به آخرش اضافه کردیم، و گفتیم که در هر حال، اگه این داروها رو به موشها بدین، قند بالا میره.
این عالی بود، و داستان میتونست همونجا تموم بشه. اما هنوز شش و نیم دقیقه وقت دارم.
(خنده)
همه جا مینشستیم و درباره ش فکر میکردیم، و یادم نیست کی به فکرش رسید، اما یکی گفت، "نمیدونم آیا مریضهایی که این دو دارو رو مصرف میکنن خودشون متوجه عوارض جانبی افزایش قند خون میشن. ممکنه و باید بشن. چطوری میتونیم مشخصاش کنیم؟
ما گفتیم، خوب، چی کار میکنی؟ یه دارو داری مصرف میکنی، یکی دو تا داروی جدید، و احساس خوبی داری. چی کار میکنی؟ میری به گوگل و اسم دو دارو که گرفتی مینویسی یا یه دارو که مصرف میکنی، و "عوارض جانبی" رو مینویسی، چه تجربهای داشتید؟ خوب ما گفتیم مشکلی نبود، بذارین از گوگل بپرسیم آیا سوابق جستجو رو به ما میگه، تا به سوابق جستجو نگاه کنیم و ببینیم مریضها چه نوع جستجوهایی رو انجام میدن. گوگل، متأسفم که اینو میگم، درخواست ما رو رد کرد. خوب، ناامید شده بودم. داشتم با یه همکار شام میخوردم که در مرکز پژوهش میکروسافت کار میکنه و گفتم، « میخواستیم این مطالعه رو انجام بدیم. گوگل جواب رد داد، یه جورایی ناامید کننده است.» گفت، «خوب، ما جستجوی بینگ رو داریم.»
(خنده)
آره. عالیه. حالا حس میکردم--
(خنده)
حس میکردم باز دارم با نیک حرف میزنم. او برای یکی از بزرگترین شرکت های جهان کار میکنه، و من داشتم سعی می کردم احساس بهتری داشته باشه. اما او گفت، «نه، راس-- شاید متوجه نشدی. ما نه تنها جستجوی بینگ رو داریم، بلکه اگه برای جستجوی گوگل از اینترنت اکسپلورر استفاده کنی، یاهو، بینگ، هر چی... بعد، برای هجده ماه، اون دادهها رو فقط با اهداف تحقیقاتی نگه میداریم.» گفتم، «این شد حرف حساب!» این اریک هورویتز بود، دوستم در میکروسافت.
پس یه تحقیق انجام دادیم پنجاه کلمه رو تعریف کردیم که یه فرد عادی ممکنه بنویسه اگه دچار افزایش قند خون بشه، مثل "خستگی،" "بی اشتهایی،" " تکرر ادراری،" "پرشاشی"-- ببخشید، اما این یکی از چیزایی هست که ممکنه بنویسید. پس پنجاه عبارت داشتیم که بهش می گفتیم "کلمات دیابت." و ابتدا یه بررسی اولیه انجام دادیم. و معلوم شد حدود نیم تا یک درصد همه ی جستجوها در اینترنت شامل یکی از این کلمات است. خوب این یه رقم اولیه بود. اگه مردم بنویسن "پاروکستین" یا "پاکسیل"-- اینها مترادف هستن-- و یکی از اون کلمات، رقم حدود دو درصد بیشتر از کلمات دیابتی میشه، اگه قبلاً بدونین که اون کلمه "پاروکستین" است. اگه اون کلمه "پراواستاتین" باشه، رقم حدود سه درصد بیشتر از رقم اولیه میشه. اگه هر دو کلمه ی "پاروکستین" و "پراواستاتین" در جستجو باشن، رقم تا ده درصد بالا میره، یه افزایش قابل توجه سه تا چهار برابری در اون جستجوها با دو تا دارو که مورد نظر ما بود، و کلمات دیابتی یا کلمات مشابه افزایش قند خون.
اینو چاپ کردیم، و تا حدودی توجهها رو جلب کرد. علت قابل توجه بودنش اینه که بیماران عوارض جانبی خودشون رو غیرمستقیم به ما میگن از طریق جستجوهاشون. ما توجه اف دی ای رو به اینها جلب کردیم. اونها علاقمند بودن. اونها برنامههایی راه انداخته بودن برای نظرسنجی در رسانههای اجتماعی برای همکاری با مایکروسافت، که زیرساختار خوبی برای انجام این کار داشت و سایر جاها، بررسی فیدهای توییتر، بررسی فیدهای فیسبوک، بررسی سوابق جستجو، برای این که سعی کنیم متوجه علائم زودرسی بشیم که اون داروها، جداگانه یا باهم، مشکلاتی ایجاد میٰکنن.
چه نتیجهای از این میگیرم؟ چرا این داستان رو میگم؟ خوب، اول از همه، ما هم اکنون چشم انداز دادههای بزرگ و دادههای متوسط رو داریمبرای کمک به فهم تداخلات دارویی و یه واقعیت اساسی، اثر داروها. داروها چه اثری دارن؟ این اکوسیستم جدیدی ایجاد خواهد کرد و ایجاد کرده برای فهم نحوه اثر داروها و بهینه سازی مصرف اونها. نیک ادامه داد؛ حالا در کلمبیا یه استاده. این کار رو در پی اچ دی خودش برای صدها جفت دارو انجام داد. صدها تداخل خیلی مهم دارویی پیدا کرد، و بنابراین توسعهش دادیم و نشون دادیم که این روش واقعاً مؤثره برای پیدا کردن تداخلات بین دو دارو.
اما، چند نکته هست. ما فقط از دو دارو استفاده نمیکنیم. همون طور که قبلاً گفتم، بعضی مریضها از سه، پنج، هفت، نه دارو استفاده میکنن.آیا مطالعهای با توجه به تداخلات نه گانه انجام شده؟ بله، میتونیم تداخلات دوتایی رو بررسی کنیم، بین آ و ب، بین آ و س، آ و د، اما همه ی اینها با هم چی؟ اگه یه مریض همه رو با هم مصرف کنه، ممکنه با هم تداخل داشته باشن به طریقی که اثراتشون بیشتر یا کمتر بشه یا عوارضی ایجاد بشه که غیرمنتظره باشه؟ در واقع چیزی نمیدونیم. این آسمون آبیه، میدان بزرگی برای ما برای استفاده از دادهها برای این که سعی کنیم تداخلات دارویی رو بفهمیم.
دو درس دیگه: ازتون میخوام به قدرتی فکر کنید که به دست میاد با دادههای افرادی که عوارض جانبی خود را داوطلبانه در اختیار ما میذارناز طریق دکتر داروساز، خودشون یا دکتر معالج، افرادی که اجازه دادن پایگاههای داده در استنفورد، هاروارد، وندربلت، برای پژوهش استفاده بشه. مردم نگران دادهها هستند. اونها نگران حریم شخصی و امنیت خودشون هستن-- باید باشن. ما به سامانه های امن نیاز داریم. اما نمیتونیم سامانهای داشته باشیم که اون دادهها رو کاملاً از دسترس خارج کنه، چون یه منبع بسیار ارزشمنده برای الهام گرفتن، نوآوری و اکتشاف برای چیزهای جدید در پزشکی.
و چیز آخری که میخوام بگم اینه که، ما در این مورد دو دارو پیدا کردیم و داستانش کمی غم انگیز بود. دو دارو که واقعاً مشکل ساز بودن.قند خون رو بالا میبردن. این داروها ممکنه فردی رو دچار دیابت کنن، که در غیر این دچار دیابت نمیشد، و بنابراین ممکنه تصمیم بگیریم در مورد مصرف هم زمان این دو دارو احتیاط کنیم، شاید از مصرف هم زمان به طور کلی خودداری کنیم، موقع تجویز دارو تصیم های متفاوتی بگیریم. اما یه احتمال دیگه وجود داره. ممکن بود دو یا سه دارو پیدا کنیم که تداخل سودمند داشته باشن. ممکن بود اثرات دارویی جدیدی پیدا کنیم که هیچ کدوم به تنهایی نداشتن، اما با هم، به جای عوارض جانبی، ممکن بود درمان جدید و نوینی باشن برای امراضی که علاج ندارن یا درمان اونها مؤثر نیست. اگه امروز درباره درمان دارویی فکر کنیم، همه درمانهای اصلی-- برای اچ آی وی، سل، افسردگی، دیابت-- همیشه ترکیبی از چند دارو هستن.
و بنابراین نکته مثبتش، و موضوع یه سخنرانی دیگه در یه روز دیگه، اینه که چطور میتونیم با استفاده از همون منابع دادهها آثار مثبت ترکیب داروها رو پیدا کنیم، که درمانهای جدیدی برای ما فراهم کنه، دیدگاههای جدیدی درباره نحوه اثر داروها ایجاد کنه و به ما امکان بده از مریضهامون بهتر مراقبت کنیم؟
خیلی متشکرم.