當前位置: 華文頭條 > 健康

和鯨攜手交大醫學院張維拓老師,開展R語言醫學數據分析工作坊

2024-01-04健康

歷時一個月,和鯨社區內的 R 語言醫學數據分析訓練營暫告一段落。

本次訓練營 由上海交通大學醫學院副研究員張維拓老師聯合和鯨社區共同發起,是面向醫學生、臨床醫生及相關從業人員開展的醫學數據科學推廣公益活動 ,旨在幫助大家快速入門 R 語言,了解臨床研究標準分析流程,並能在論文復現的過程中學會做出符合頂刊發表要求的論文圖表。

考慮到報名的大多數醫學專業的學員可能不具備 R 語言編程基礎,本次活動別開生面地采用了 「線上訓練營+線下工作坊」 的混合式教學模式:線上訓練營提供三份「提前學」教案,搭配張老師的講解,幫助大家打下必要的醫學數據分析的概念和技術基礎;線下工作坊拔高難度,學員在老師和助教的指導下完成分組實操練習。

線上訓練營:頂刊論文復現從圖表開始

線上訓練營的目標是帶領大家 復現 2015 年發表於 NEJM 的 A Randomized Trial of Intensive versusStandard Blood-Pressure Control(又被稱為 SPRINT 研究)論文中的主要統計分析方法,並制作符合論文發表要求的圖表

醫學論文中的圖表制作一直是個難點,對於醫學生來說很少有特定的課程專門教授圖表的制作,電腦或統計學專業的學生也無法勝任,因為它 不僅需要編程技術,更需要對專業知識的理解與分析思路 。張維拓老師線上上第一節課中講解醫學數據分析的三個基本概念——「數據+科學問題+分析框架」時就說到,很多學生一上來就做很多各式各樣的圖表,但關註的問題是散的,這是不對的。

圖:線上訓練營的三次課程

首次課程從 如何用 R 畫出一張基線特征表 (簡稱「基線表」)開始,透過這張表可以觀察研究人群的代表性和可比性。張老師為大家講解了醫學數據分析的基本概念,以及零基礎的同學也能聽懂的用 R 處理數據的基本操作,帶領大家一步步畫出這張大多數臨床研究報告或論文中的 Table1 。

第二次課程的主題為長表分析, 長表格式是多次隨訪數據比較推薦的記錄形式 。這節課的內容包括了寬表轉長表的方法、長表分析的核心技巧(分組匯總)、以及基於 ggplot和 ggpubr 的隨訪統計圖的繪制。過程中,張老師也穿插了講解了一些臨床研究的基本概念,比如觀察指標和結局之間的差異。

第三次課作為線上訓練營的收官, 聚焦於主要結果圖和主要結果表的制作 ——這 1 圖 1 表用於支撐論文的核心觀點,囊括了全文 80% 的精華。為了便於初學者更快上手,張老師還自編了個包名叫 litertable,可用於快速生成臨床醫學研究中的常用表格。過程中,學員們進一步理解了,技術只是手段,思維和邏輯才是主導。

我們在進行醫學結局判定的時候,是不能以,或者說不能主要以單一的醫學實踐作為我們的研究重點的,這也是為什麽醫學數據分析很多時候只得靠醫生來做,而不能靠專業的數據分析人員來做。

圖:線上訓練營的第三次課課件展示

線下 workshop:3 小時頂刊論文復現實操

線下 workshop 是線上訓練營的進階,以「老師講解+分組實操」的形式,要求參與的學員現場復現 2016 年發表於 NEJM 的論文 Randomized Trial of Introduction of Allergenic Foods in Breast-Fed Infants(可簡稱 Eat 研究 )。 來自仁濟醫院、瑞金醫院、上海第九人民醫院、上海交大醫學院的近 30 名臨床醫生與醫學生共同參與

圖:線下工作坊,張維拓老師正在講解課件

籌備時,張老師曾擔憂學生會不會因為跟不上進度而失去信心,產生畏難情緒,因為線下的課程內容在數據量增大的同時,更設定了五項挑戰任務,除了線上訓練營所涉及到的繪制基線表、主要結果圖之外,還要求學生自主進行探索性分析,在原有結論的基礎上進一步深入挖掘。

而令人喜出望外的是,現場的所有學員都十分積極主動,即使過程中遇到了解不了的疑難問題,也能在老師和助教的幫助下堅持探索, 最終有 60% 的小組都順利完成了 5 項挑戰任務 ,其他小組也平均完成了 3-4 項,並收獲了對應的紀念禮品。

圖:學生們正在分組實操

圖:張維拓老師與5位學生的合影

活動結束後,我們收集了大家的反饋。

來自上海交通大學醫學院護理學院的何同學從沒有用過 R 語言,這次堅持「跑完了整個馬拉松」,她說:「 作為小白聽線上課程很受益 ,線下課程內容很豐富,但我沒來得及做完所有挑戰,希望後續能透過一次次活動逐步提升能力,更高效率地完成培訓。」

來自仁濟醫院的王同學雖然過去有跑透過別人的程式碼,但是沒有自己編寫程式碼的經驗,這次只參加了線下工作坊,他說:「感謝張老師,內容很專業, 對我們科研有很大幫助! 希望以後能有更多類似培訓。」

還有幾名參加了線上訓練營但未能來到現場的同學,不約而同地 稱贊了論文復現實操 這樣的形式。

活動的背後

「線上訓練營+線下工作坊」,事實上,這也是和鯨社區第一次以二者相結合的形式舉辦活動。過程中,不管是張維拓老師還是和鯨營運人員都花費了成倍的時間精力,但我們很開心地看到,這樣的投入確實讓學員們得到了更好的學習體驗。

感謝張維拓老師,從確定活動舉辦開始毫無保留的付出,到策劃溝通時一切為學生考慮,還有上課時專業與風趣兼備,張老師的優秀與熱情感染了大家,激發了大家探索醫學數據分析的興趣。

很高興能夠有機會同和鯨平台共同組織此次 R 語言醫學數據分析訓練營線下工作坊活動。本次活動透過和鯨平台現場演示的形式,幫助零基礎醫學生上手 R 語言,透過復現醫學頂刊論文,掌握臨床研究數據分析思路和圖表制作方法。活動過程中,同學積極提問,互相幫助溝通,多數同學都完成了活動挑戰任務,對醫學數據的處理和使用有了更深的認知。此次線下工作坊,幫助更多醫學專業相關的同學開啟了醫學數據 R 語言分析的大門,也為後續的線下工作坊活動打下了良好範本。

圖:張維拓老師正在講解教案

另外,和鯨為本次活動提供全流程營運與實訓平台支持。 訓練營和 Workshop 都是和鯨社區內的常規活動形 式,實操所使用的工具是和鯨旗下的數據科學教學-實訓平台 ModelWhale, 雲端環境讓學生「開啟網頁學編程」 ,數據、算力自動連線,學生可以一鍵復現老師的教案,Jupyter Notebook 搭配簡單易用的版本管理,能讓初學者放心大膽地編寫與修改,同時平台支持作業的線上收發與自動評審,節省老師時間。

圖:和鯨社區活動頁

最後感謝南京師範大學教授胡傳鵬老師、中國科學院新疆理化技術研究所胡鵬偉博士對本次活動宣推上的貢獻。應同學們的強烈呼聲,明年張維拓老師或將與和鯨共同舉辦二期工作坊,敬請期待!

如果您對本次活動感興趣,或也想以「線上訓練營+線下工作坊」這樣的形式舉辦類似數據科學實踐活動,歡迎掃描進入 ModelWhale 官網掃描右側二維碼聯系我們 (添加時煩請備註「醫學workshop」)。您也可以在官網 免費試用全程支持本次活動開展的 ModelWhale 平台 ,了解、體驗論文復現過程。