Pembelajaran mesin federasi memungkinkan studi tumor otak terbesar saat ini, tanpa berbagi data pasien

Kredit: Domain Publik Unsplash/CC0

Para peneliti di Penn Medicine dan Intel Corporation memimpin upaya pembelajaran mesin global terbesar hingga saat ini untuk mengumpulkan pengetahuan secara aman dari pemindaian otak 6.314 pasien glioblastoma (GBM) di 71 lokasi di seluruh dunia dan mengembangkan model yang dapat meningkatkan identifikasi dan prediksi batas dalam tiga sub-kompartemen tumor, tanpa mengorbankan privasi pasien. Temuan mereka dipublikasikan hari ini di Nature Communications.

“Ini adalah kumpulan data pasien glioblastoma terbesar dan paling beragam yang pernah dipertimbangkan dalam literatur, dan dimungkinkan melalui pembelajaran federasi,” kata penulis senior Spyridon Bakas, Ph.D., asisten profesor Patologi & Kedokteran Laboratorium, dan Radiologi , di Fakultas Kedokteran Perelman di Universitas Pennsylvania. “Semakin banyak data yang dapat kami masukkan ke dalam model pembelajaran mesin, semakin akurat jadinya, yang pada gilirannya dapat meningkatkan kemampuan kami untuk memahami, merawat, dan menghilangkan glioblastoma pada pasien dengan lebih presisi.”

Para peneliti yang mempelajari kondisi langka, seperti GBM, jenis tumor otak yang agresif, seringkali memiliki populasi pasien yang terbatas pada institusi atau lokasi geografis mereka sendiri. Karena undang-undang perlindungan privasi, seperti Undang-Undang Portabilitas dan Akuntabilitas Asuransi Kesehatan tahun 1996 (HIPAA) di Amerika Serikat, dan Peraturan Perlindungan Data Umum (GDPR) di Eropa, kolaborasi berbagi data lintas institusi tanpa mengorbankan data privasi pasien merupakan kendala utama untuk banyak penyedia layanan kesehatan.

Pendekatan pembelajaran mesin yang lebih baru, yang disebut pembelajaran federasi, menawarkan solusi untuk rintangan ini dengan membawa algoritme pembelajaran mesin ke data alih-alih mengikuti paradigma saat ini yang memusatkan data ke algoritme. Pembelajaran federasi—sebuah pendekatan yang pertama kali diterapkan oleh Google untuk fungsi koreksi otomatis keyboard—melatih algoritme pembelajaran mesin di beberapa perangkat atau server terdesentralisasi (dalam hal ini, institusi) yang menyimpan sampel data lokal, tanpa benar-benar menukarnya. Sebelumnya telah terbukti memungkinkan dokter di institusi di berbagai negara untuk berkolaborasi dalam penelitian tanpa berbagi data pasien pribadi.

Bakas memimpin studi kolaboratif besar-besaran ini bersama dengan penulis pertama Sarthak Pati, MS, seorang pengembang perangkat lunak senior di Penn’s Center for Biomedical Image Computing & Analytics (CBICA), Ujjwal Baid, Ph.D., seorang peneliti postdoctoral di CBICA, Brandon Edwards, Ph.D. .D., ilmuwan riset di Intel Labs, dan Micah Sheller, ilmuwan riset di Intel Labs.

“Data membantu mendorong penemuan, terutama pada kanker langka di mana data yang tersedia langka. Pendekatan federasi yang kami uraikan memungkinkan akses ke data maksimal sambil menurunkan beban institusional untuk berbagi data.” kata Jill Barnholtz-Sloan, Ph.D., asisten profesor di Case Western Reserve University School of Medicine.

Model mengikuti pendekatan bertahap. Tahap pertama, yang disebut model awal publik, dilatih sebelumnya menggunakan data yang tersedia untuk umum dari tantangan Segmentasi Tumor Otak Internasional (BraTS). Model tersebut ditugaskan untuk mengidentifikasi batas-batas tiga sub-kompartemen tumor GBM: “enhancing tumor” (ET), mewakili kerusakan penghalang darah-otak vaskular di dalam tumor; “inti tumor” (TC), yang mencakup ET dan bagian yang membunuh jaringan, dan mewakili bagian tumor yang relevan untuk ahli bedah yang mengangkatnya; dan “seluruh tumor” (WT), yang ditentukan oleh penyatuan TC dan jaringan yang disusupi, yaitu seluruh area yang akan dirawat dengan radiasi.

Data pertama dari 231 kasus pasien dari 16 lokasi, dan model yang dihasilkan divalidasi dengan data lokal di setiap lokasi. Tahap kedua, disebut model konsensus pendahuluan, menggunakan model awal publik dan memasukkan lebih banyak data dari 2.471 kasus pasien dari 35 lokasi, yang meningkatkan akurasinya. Tahap akhir, atau model konsensus akhir, menggunakan model yang diperbarui, dan menggabungkan jumlah data terbesar dari 6.314 kasus pasien (3.914.680 gambar) di 71 lokasi, di 6 benua, untuk lebih mengoptimalkan dan menguji generalisasi ke data yang tidak terlihat.

Sebagai kontrol untuk setiap langkah, peneliti mengecualikan 20 persen dari total kasus yang disumbangkan oleh setiap lokasi yang berpartisipasi dari proses pelatihan model dan digunakan sebagai “data validasi lokal”. Hal ini memungkinkan mereka untuk mengukur keakuratan metode kolaboratif. Untuk mengevaluasi lebih lanjut generalisasi model, enam lokasi tidak terlibat dalam salah satu tahap pelatihan untuk mewakili populasi data “out-of-sample” yang sama sekali tidak terlihat dari 590 kasus. Khususnya, situs di American College of Radiology memvalidasi model mereka menggunakan data dari studi uji klinis nasional.

Mengikuti pelatihan model, model konsensus akhir menghasilkan peningkatan kinerja yang signifikan terhadap data validasi lokal kolaborator. Model konsensus akhir mengalami peningkatan sebesar 27% dalam mendeteksi batas ET, 33% dalam mendeteksi batas TC, dan 16% untuk deteksi batas WT. Hasil yang ditingkatkan merupakan indikasi yang jelas tentang manfaat yang dapat diperoleh melalui akses ke lebih banyak kasus, tidak hanya untuk meningkatkan model, tetapi juga untuk memvalidasinya.

Ke depan, penulis berharap bahwa karena metodologi generik pembelajaran federasi, penerapannya dalam penelitian medis dapat menjangkau jauh, tidak hanya berlaku untuk kanker lain, tetapi kondisi lain, seperti degenerasi saraf, dan seterusnya. Mereka juga mengantisipasi lebih banyak penelitian untuk menunjukkan bahwa federated learning dapat mematuhi protokol keamanan dan privasi di seluruh dunia.

Informasi lebih lanjut: Pembelajaran federasi memungkinkan data besar untuk deteksi batas kanker yang langka, Nature Communications (2022). DOI: 10.1038/s41467-022-33407-5 Disediakan oleh Perelman School of Medicine di University of Pennsylvania

Kutipan: Pembelajaran mesin federasi memungkinkan studi tumor otak terbesar hingga saat ini, tanpa berbagi data pasien (2022, 5 Desember) diambil 5 Desember 2022 dari https://medicalxpress.com/news/2022-12-federated-machine-enables- terbesar-otak.html

Dokumen ini tunduk pada hak cipta. Terlepas dari kesepakatan yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.