資料分析服務供應商Databricks,根據產業特性提供不同的資料分析功能,在早前推出金融服務專用的湖邊小屋,而現在Databricks發布針對醫療保健與生命科學領域的湖邊小屋,目標是突破傳統資料倉儲的限制,提供企業更快更即時的醫療分析解決方案。

Databricks的湖邊小屋架構,結合資料倉儲和資料湖的特性,讓用戶可以在開放格式的雲端儲存中,實作類似資料倉儲的資料結構和資料管理功能,發展商業智慧、資料科學和機器學習等資料應用。

官方提到,用在醫療保健和生命科學領域的傳統資料技術,存在一些限制,包括資料孤島和半結構化資料、非即時的批次處理,而且也無法支援進階分析功能。醫療資料存在許多資料類型,包括註解的半結構化資料,或是圖像等非結構化資料,加上資料孤島的困境,使得醫療領域難以發展先進資料應用,而且快速增加的資料超過原本基礎設施可以處理的規模,因而也阻礙了人口層級的研究。

另外,過去的批次處理和分析工具,限制了供應鏈以及ICU床位容量等即時應用的開發,在傳統的資料架構上,更是難以發展進階分析或是人工智慧等用例。

而Databricks利用湖邊小屋解決方案,試圖解決醫療保健與生命科學領域,發展資料科學應用所遭遇到的困難,湖邊小屋對所有的資料、分析和人工智慧工作負載,提供一個開放且跨雲的平臺,在這個基礎上,Databricks與其合作夥伴,共同提供疾病預測、醫學圖像分類和生物標記探索等應用案例。

專用於醫療保健與生命科學的湖邊小屋,採用開放式設計,藉由支援各種資料類型打破資料孤島,利用非結構化資料建構出病患全貌。而且因為湖邊以雲端技術為基礎,能夠高效能地處理資料,官方提到,Regeneron製藥公司使用該解決方案,將資料處理時間從3周減至5小時,而針對150萬外顯子(Exome)的基因型與表現型查詢,時間從30分鐘縮短至3秒鐘。

湖邊小屋另一個好處,便是能夠支援即時應用,Databricks表示,傳統的資料倉儲並非設計用於即時應用,而湖邊小屋則可以處理串流資料執行即時分析,用於管理ICU容量,或是需要溫控的疫苗分配。湖邊小屋提供了一套分析和人工智慧工具,供用戶使用機器學習技術,加速新藥開發或是改善病患護理。

熱門新聞

Advertisement