計畫研究簡介

子計畫四「健康資料分析與運算中心」

 

研究背景

 

在數據科學的時代下,資料呈指數型成長,群體健康與公衛相關的資料收集亦快速地延展規模,自海量資訊的探勘與分析中增進對健康相關危害的了解與評估,推動精準化公共衛生的進展。舉例來說,英國人體生物資料庫(UK Biobank)[14]為目前世界最大且可公開申請的流病資料庫,包含了五十萬人、數千種表徵型資料(問卷、初級與住院照護等),並與參與者的基因體資料進行串聯。在此背景下,統計與計算之需求持續攀升,而即使已有長足進展,目前院內資料中心的軟硬體尚無法同時支持多個研究室規模化(scalable)的資料分析,也缺乏人力進行定期的統計教學與資料平台的建立。除了院內運算需求,頻繁的跨院合作(如醫學院的精準醫療計畫),亦亟需健康研究相關運算資源之整合與統計諮詢服務,以強化跨團隊的合作與支援。以這些背景為標竿,子計晝四將扮演整個健康資料分析與運算中心子計畫的核心,支持全院的資料運算與統計諮詢,串連所有主題,擴增軟體與硬體以支援資料之儲存與運算,收集與整合健康數據,提供統計計算與諮詢等相關教育訓練,並在此基礎下協助與執行其他子計畫與院內其他四個院內教師長久耕耘的群體健康分析研究。

 

本計畫也將繼續經營與善用前一期本學院執行高教深耕特色領域中心計畫(2018-2020),投注大量經費建置的資訊設備與已蒐集的健康資料,這個資料中心將扮演重要的支持性角色,提供上述三個研究主軸所需要的資料蒐集、彙整、儲存、運算、統計分析等硬體資源與軟體協助,也將舉辦教育訓練課程,推廣健康大數據的應用,培訓更多相關專業人力,並善用與充實軟硬體設備,協助研究團隊成員進行資料串聯與分析,開發更多具有潛力的跨領域研究主題

 

 

 

 

 

 

研究目標

 

因應健康數據快速且持續地擴展,統計與運算資源需求的上升,本計畫將擴建原有的支援統計計算的健康資料分析與運算中心,以強化軟體與硬體的設備以支援群體健康資料儲存、探勘與研究為首要目的,並持續提供相關的統計教育訓練與諮詢,以及協助與執行院內教師之主題性健康研究。

 

  1. 資料運算與教育諮詢:整合健康研究相關之運算資源與計算,提供教育訓練與統計諮詢,強化跨團隊合作與支援。

  2. 傳染性疾病研究:獎助COVID-19及新興傳染病主題之研究、持續推動傳染病學學程與傳染病防治相關課程/講座、規劃舉辦傳染病相關職涯活動。

  3. 非傳染性疾病研究:發展健保資料庫非傳染性疾病發生率與盛行率方法、應用於癌症、心血管等疾病在社區及族群層監測,提出預防與治療相關證據。

  4. 全球疾病負擔之跨領域合作:估算健保資料庫盛行率之效度與校正、建立高齡社會的長照需求指標、描述與解析台灣健康不平等的現狀、轉譯疾病負擔之實證結果。

  5. 環境健康衝擊研究:收集資料建構環境變遷與空氣汙染關聯資料庫、模擬環境變遷情境對空氣汙染與人類健康衝擊效應。