騰訊的“移動互聯(lián)網+AI”,正通往移動醫(yī)療
BAT們與各路資本齊齊砸下血本,對這個AI技術當下最熱門的垂直場景之一發(fā)起了多輪攻勢。AI與醫(yī)療的雙高門檻,是區(qū)別于兩年前移動醫(yī)療熱潮的最重要因素之一。但是,將上一輪移動醫(yī)療熱情徹底澆滅的那些教訓,卻仍然值得此輪醫(yī)療創(chuàng)業(yè)者借鑒。
當下,移動醫(yī)療從2015年下旬開始經歷的那一場突然而又漫長的寒冬,已基本無人談起。
那是2015年吧,移動醫(yī)療就已經死了一批了,有些融完A輪就不行了。后來慢慢的,相比移動醫(yī)療,大家就開始更多地用數字醫(yī)療這個詞了。這是一位從2014年就開始深入調查分析醫(yī)療創(chuàng)業(yè)項目的分析師給到我們的碎片式回憶。
實際上,早在2016年10月,動脈網根據深入調查而出具的一份名為《互聯(lián)網醫(yī)療生存報告:38家企業(yè)為什么死去?》的醫(yī)療創(chuàng)業(yè)項目倒閉白名單,曾轟動一時。
其中,技術含量不高導致的創(chuàng)業(yè)同質化,對醫(yī)療工作流程特殊性的錯誤理解,監(jiān)管層面的約束,對市場的忽視,以及過高的估值與資本介入,都是那時候醫(yī)療創(chuàng)業(yè)者用血與淚換來的教訓。
2016年中旬左右,幾乎像是一場足球比賽上下場的轉換,AI+醫(yī)療強勢崛起。這個難得讓BAT與資本們共同找到興奮點的醫(yī)療新賽道,在過去不到2年的時間里,孕育出超過100家以醫(yī)療為重點的AI創(chuàng)業(yè)公司。
如果再快進到2017年,你會發(fā)現在過去的9個月中,國內外以醫(yī)療為重點的AI創(chuàng)業(yè)公司獲得融資的頻率幾乎可以媲美曾紅極一時的共享充電寶。其中,醫(yī)療影像自動化診斷算是一個近期各家齊頭并入的熱門應用場景。
當然,與曾經同質化嚴重的移動醫(yī)療相比,極高的AI門檻加上極高的醫(yī)療門檻,讓進入AI醫(yī)療界的一眾創(chuàng)始人們一開始就似乎有了睥睨天下的資本。
業(yè)內人士,算法專家,海歸博士與其他AI創(chuàng)業(yè)公司并無太多差異,技術與研發(fā)當仁不讓成為公司宣傳的核心;而資本方也難得進入高僧打坐模式,只是期待,閉口不談商業(yè)模式與盈利要求。
那么,一個如此早期的領域,只有拼技術就夠了?移動醫(yī)療曾經經歷的那一場暴風雪,是否也有相似的教訓值得當下借鑒?
VoxelCloud(體素科技),算是最近一頭扎入這個領域的AI創(chuàng)業(yè)公司中比較露鋒芒的一個。2016年才成立,就在2017年5月獲得紅杉領投的千萬級融資;僅隔3個月,又在今天得到騰訊的超億元人民幣A+輪投資。很顯然,這個數額與融資頻率應該會讓當下一眾同類型的創(chuàng)業(yè)公司十分眼紅。
當然,盡管騰訊有自己醫(yī)療布局的考慮在內(剛剛推出一款醫(yī)療影像產品覓影),但對于選投VoxelCloud的理由,騰訊與紅杉的口徑較為一致:
他們之前就有了明確的產品,以后還會有更多創(chuàng)新性應用。
VoxelCloud的創(chuàng)始人丁曉偉很爽快地接受了我們的專訪,而且并不避諱一些敏感問題。不過,自始至終,對于AI醫(yī)療,他的態(tài)度是謙卑且謹慎的,甚至承認現在的技術和硬件并不天然滿足醫(yī)療應用級產品的研發(fā),需要通過大量另辟蹊徑實現。
我們有技術,有很強的人,但是我們也必須考慮商業(yè)模式,也需要正確面對那些市面上的AI醫(yī)療診斷系統(tǒng)曾經犯過的錯誤。
只談學術,不談應用,這不靠譜
借助先進的人工智能技術,系統(tǒng)在短時間內處理海量數據,并對病人做出愈加準確的診斷。這是IBM旗下的AI診療系統(tǒng)Watson曾做出的承諾。
然而,在IBM將Watson推向全世界的6年里,這個AI醫(yī)療領域最負盛名的產品,卻遭到了無數醫(yī)生的質疑與媒體的嘲諷。
可靠的技術,高質量的數據,醫(yī)生的配合。事實上,這些在研發(fā)人員中最為看重的幾個因素,一旦合體落實到臨床實驗中,就會遇見各種各樣的麻煩。這就像一個僅有完整的身體與四肢,卻沒有關節(jié)與潤滑劑的機器人,只能是一個無法動彈的殘次品。
譬如,在實際工作中,Watson合作醫(yī)院的醫(yī)生們真的會主動用它來處理病患信息嗎?醫(yī)生輸入數據過程中是否會遇到各種問題?給出的診斷結果是否會參考不同國別、人種的差異?
作為加州大學洛杉磯分校的計算機視覺博士,VoxelCloud的創(chuàng)始人丁曉偉并沒有否認研發(fā)與應用之間橫亙著巨大的鴻溝。那些在實驗室中熠熠閃光,讓人十分興奮的技術與樣品,其實很容易見光死。
這也是他為何通常在產品研發(fā)過程中,選擇與醫(yī)生們一待就是6個月的原因:
我雖然學的是計算機視覺這一學科,但是我家人都是醫(yī)生,我基本從小就長在中國的醫(yī)院里。哪個科室做什么,到底怎樣運轉,我都見過。我覺得,做醫(yī)療產品必須走到醫(yī)院里,去觀察醫(yī)生的每一步到底是怎么做的。
譬如我們在研發(fā)無創(chuàng)肺癌篩查診斷系統(tǒng)的時候,就跟醫(yī)生長時間一起工作,大概要相處半年吧,天天在一起討論。這不是說我們一定要掌握哪一種病癥,而是要去了解這個病的知識難點,看看醫(yī)生處理的時候會有哪些問題。然后我們再獨立去分析一個病種的時候,再去考慮怎么與深度學習技術融合。
另外在臨床實驗過程中,對某一項任務的安全編制,醫(yī)生的需求是什么,這里面的容錯空間有多大,做成什么樣子是最能為他們解決問題的,這些都是非常細節(jié)的問題。
你不走進醫(yī)院,你絕對不知道有哪些很棘手的問題。
但是,即便與醫(yī)院進行長時間無縫隙合作,也不能保證機器給出的治療方案給出的一定是精準的,或者是被醫(yī)生認同的解決方案。這就像歐洲一些曾對Watson系統(tǒng)多有抱怨的醫(yī)生透露,Watson給出的建議帶有針對美國患者與美國醫(yī)院治療方案的傾向。
對于這個疑問,丁曉偉首先提出了一個大部分人對人工智能醫(yī)療應用的理解誤區(qū):機器診斷報告一定需要與某個醫(yī)生的主觀印象高度匹配。
他認為,與醫(yī)生主觀印象做比對是一種錯誤的認知,機器診斷結果,應該在有條件的情況下,去對比該疾病的金標準檢查結果(GoldStandard)。
早期疾病的篩查在絕大多數狀況下,不確定性是不可避免的。而且醫(yī)生也知道,在初步篩查結果下得到的只是初步意見,不能作為金標準來下定論。我們能夠保證的,是基于數據信息量,讓病癥在某一階段的診斷準確率無限接近金標準。
當然,如果出現某一特殊病癥沒有現有的金標準可以參考,也同時為了保證診斷結果的客觀性,我們會請權威醫(yī)療專家,把他們分成4~5組,分別獨立去做一批數據診斷,對數據做質控標記。
這就相當于,把我們的系統(tǒng)作為第6組醫(yī)生,它與每一組醫(yī)生的差異率要維持在這幾組醫(yī)生之間差異率之內。
實際上,一些市場中現有計算機輔助診斷系統(tǒng)出現的問題,在某種程度上也被丁曉偉認為是AI醫(yī)療產品之間存在的目標性差異。
譬如,有些公司可能只做圖像診斷,給出一個輔助性的診斷結果,而有些產品是既給出診斷結果,也會改進醫(yī)生的工作流程,把醫(yī)生寫報告、做隨訪的時間也給一同安排了。大概我們的產品在人性化方面會要求的更高一些,丁曉偉說得比較委婉。
你看市面上的大部分的診斷應用,可能都是機械地去做特定疾病檢測與判斷。這起到的是查缺補漏的作用,因為我們顯然不可能完全相信算法。
但我想讓自己的系統(tǒng)多一點特性,就是能給予醫(yī)生一種信任感,讓人不會覺得那么生硬。你看,就像完成一個機械動作,人與機器都能完成,但是過程與感覺是不一樣的。
作為醫(yī)生,除了給出一個診斷,他還具備『處理不確定性的能力』。他知道哪些是不確定的,會去找上級醫(yī)生尋求幫助,會去尋求更進一步的但代價更大的醫(yī)學檢查。
舉個例子,某一種病的治療方案如果沒有特別有說服力的信息量,醫(yī)生的選擇總是通過各種各樣的方式去驗證,譬如不斷地去隨訪,或者尋求外部援助。而這些機制機器都是通通忽略的,妄圖在一次檢查中給出最好的答案。
換句話說,在他的認知中,一件成功的醫(yī)療診斷產品,不僅會學習海量的數據,還要對診斷過程有一個深度理解。把醫(yī)生寫報告,向上級尋求幫助,二次審核等梯級任務都學到手,具備像人類一樣的處理不確定性的能力。
某種程度上,這個設想與GoogleDeepmind團隊一邊做糖網病篩查診斷系統(tǒng),一邊研發(fā)醫(yī)務支持與任務管理系統(tǒng)的兩手抓計劃有共通之處。
所以,我們想優(yōu)化的是整個看病流程,而非僅僅提高一個診斷結果的準確率。這不是一個單純拼技術水平高低的問題,而是誰能在現實診療過程中更有風險控制的能力。
但是,無論通過什么手段來保證診斷的準確率與提升醫(yī)生的滿意度,丁曉偉也承認一定需要考慮地域之間的差異。這也是VoxelCloud在美國與中國分別設立研發(fā)中心,與美中兩國醫(yī)療機構同時進行項目試驗的根本原因:
我們的研發(fā)中心是洛杉磯,跟梅奧醫(yī)學中心,UCLA醫(yī)學中心的關系也非常好,項目都是一起合作的。在國內,雖然合作醫(yī)院需要取得授權才可以透露名字,但已經有100多家了,都是北京和上海的三甲醫(yī)院。
這樣做的理由,不只是因為病患的數據會有地域差異。國內外的診療流程也很不一樣,兩者都是相輔相成的,而且兩地的研發(fā)結果也能做到互補,我們必須同時考慮到。
VoxelCloud與交大洽談醫(yī)療影像合作
數據是否是核心競爭力?
好算法雖然是價值千金,但是好數據卻更是千金難買。
風投機構8VC的CEOJoeLonsdale曾在今年在斯坦福舉行的LightForum會議上稱:做醫(yī)療診斷一開始遇到的挑戰(zhàn)就在于搜集與創(chuàng)建數據。
而美國癌癥中心MDAnderson的一位負責人也認為,只有在擁有上萬患者數據的前提下,才能初步找到針對性治療模式:
從各種患者數據中找到不同的特征很關鍵,這對針對性治療與精確用藥非常有幫助。但是如果不能擴大現有數據集,上述愿景是無法實現的。你可能只有1萬個肺癌患者數據,但其實這個數字并沒有很大。
此外,一位專注于醫(yī)療創(chuàng)業(yè)項目的分析師告訴機器之能:現在AI醫(yī)療初創(chuàng)項目之間的競爭核心,就在于誰能拿到更多的數據。
很簡單,醫(yī)療數據之于醫(yī)療診斷的重要性,就像道路測試之于無人駕駛汽車。你只有不斷地讓汽車去實地訓練,不斷地收集與咀嚼道路數據,才能繪制出更高精的地圖,逼近更高的安全數值。
同理,人體的復雜性更是不必多說。這也是為何IBM的數據工程師與醫(yī)生們耗費了六年之久,才僅僅讓Watson學習了7種癌癥;而科技巨頭與這個領域內所有創(chuàng)業(yè)公司也只能從單一的或者兩三種疾病入手來進行摸索學習。
丁曉偉也認同這個觀點。他認為,目前這個市場,大多數公司都在做肺癌、糖網病的AI醫(yī)療診斷,一方面是因為這些病種發(fā)病率非常高,影響范圍非常廣,且難以攻克,所以研究價值非常大。
而另一方面,其實是因為這些病的數據比較容易能拿到,包括網絡等很多途徑都是能搜集到很多案例的。
這些可能是起點與上手都相對其他病癥來說更容易一些(不是說本身容易)的項目,所以大家都從這幾個病種入手。
目前大多數AI醫(yī)療公司研究最多的4種病癥:肺癌、糖網病、冠心病、肝病
根據知名醫(yī)療媒體mobihealthnews的一份調查,在醫(yī)療領域,數據的收集形式其實很豐富,包含臨床實驗、醫(yī)生報告、醫(yī)學圖像、傳感器和生物樣本等多種獲取途徑。
然而,如何獲取優(yōu)質數據,特別是干凈的患者數據,對于所有該領域的公司來說,是更為至關重要的。
不管是研究項目、還是產品項目,模型的能力是不可能超出收集數據的質量。目前對于癌癥來講,可能最有效的做法就是取得病人的手術活檢,或者穿透活檢的病例結果,然后把這個結果作為金標準用于目前的訓練。
但問題在于,在一家醫(yī)院里,有活檢病人的數量是遠少于沒有活檢病人數量的。丁曉偉這樣解釋高質量數據的重要性。
換句話說,要保證有持續(xù)的高質量數據的輸入,公司只能盡可能多得通過與醫(yī)院及其他醫(yī)療機構的合作來獲得。因此,如何拿下醫(yī)院的合作項目,也是鑒別AI醫(yī)療創(chuàng)業(yè)公司生存能力的一個重要衡量標準。