8月7日消息,據(jù)國外媒體報道,IBM將給其醫(yī)療數(shù)據(jù)庫加入醫(yī)學圖像,其沃森人工智能技術(shù)將能夠通過挖掘那些信息幫助醫(yī)生做出診斷。
該公司周四宣布,它將以10億美元收購醫(yī)學圖像軟件公司Merge Healthcare。
在今年4月設(shè)立沃森醫(yī)療業(yè)務(wù)后,IBM先收購了幾家規(guī)模較小的醫(yī)療數(shù)據(jù)公司,并跟蘋果、Johnson & Johnson和Medtronic建立合作關(guān)系。上周,IBM宣布與大型藥房連鎖店CVS Health達成合作,將開發(fā)數(shù)據(jù)驅(qū)動型服務(wù)來幫助糖尿病、心臟病等慢性疾病患者更好地進行健康管理。
而對于Merge Healthcare的收購,既是一筆大規(guī)模投資,對于IBM新成立的沃森醫(yī)療部門而言也是新的資源。IBM負責該項業(yè)務(wù)高級研究副總裁約翰·凱利(John Kelly)在受訪時表示,“我們將給沃森和分析部門帶來醫(yī)療保健領(lǐng)域最大的數(shù)據(jù)集——圖像。”
據(jù)IBM研究人員估計,像CAT掃描圖、X光照片和乳房X線照片這樣的圖像在當下所有的醫(yī)療數(shù)據(jù)中的占比高達90%左右。那些圖像和病患的電子病歷通常都是分開處理的。例如,放射科醫(yī)師一天可能要檢查成千上萬張病患的圖像,但他們只會去辨別圖像上的異常情況,而不會同時考慮到病患的病歷、治療和用藥方案。
“沃森將能夠同時理解這兩方面的情況。”凱利說。
沃森人工智能技術(shù)目前主要應(yīng)用于分析文件和網(wǎng)絡(luò)上的文本。
但凱利指出,在過去的兩年里,IBM的實驗室研究人員一直在訓練沃森人工智能引擎的圖像識別能力。“也就是說,我們要給沃森帶來眼睛。”
總部位于芝加哥的Merge Healthcare專門研究存儲、查看和共享醫(yī)學圖像的軟件。它的技術(shù)為諸多的醫(yī)療保健服務(wù)提供商和圖像設(shè)備廠商廣泛使用,它使用存檔圖像的權(quán)限大小因客戶要求和州及聯(lián)邦的醫(yī)療隱私法規(guī)而異。
medical images是沃森醫(yī)療業(yè)務(wù)設(shè)立以來IBM所收購的第三家醫(yī)療數(shù)據(jù)公司。4月,它同意收購兩家創(chuàng)業(yè)公司:Explorys和Phytel。Explorys是克利夫蘭診所的剝離公司,它擁有的5000萬名病患的數(shù)據(jù)用于發(fā)現(xiàn)疾病、治療方案和治療結(jié)果的模式。位于達拉斯的Phytel致力于打造管理病人護理和降低患者再入院比例的軟件。這兩筆交易規(guī)模較小,但相關(guān)財務(wù)細節(jié)并未披露。
作為云服務(wù)銷售的沃森技術(shù)可用于幫助IBM客戶從他們在運營中收集到的數(shù)據(jù)發(fā)現(xiàn)模式規(guī)律。而醫(yī)療保健堪稱IBM為一整個行業(yè)打造全面的產(chǎn)品的首個領(lǐng)域。
以往,用于醫(yī)療的自動化決策支持系統(tǒng)一開始往往為人們所看好,但結(jié)果卻讓人失望,在實踐中的用途很有限。但IBM認為其沃森技術(shù)能夠在未來幾年帶來真正的突破。
該公司相信自己能夠在改善醫(yī)療保健上成為技術(shù)領(lǐng)導者,給病患帶來更好的治療結(jié)果,同時幫助服務(wù)提供商、保險商和病患有效減少支出。
4月接受采訪的時候,IBM CEO弗吉尼亞·羅曼提(Virginia M. Rometty)談到了公司這些年在給從計算機化人口普查數(shù)據(jù)到將宇航員送上月球的重大項目提供技術(shù)上的角色。
她說,“我們的‘登月’項目將會是在醫(yī)療保健領(lǐng)域產(chǎn)生重大影響。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領(lǐng)域帶來了效率和精度的雙重突破。