医疗初创公司Mendel获4000万B轮融资
随着信息技术进步、受新冠疫情影响,全球医疗数据储量迅猛增长,数据类型复杂。临床医疗数据按照结构类型分为结构化与非结构化临床数据。结构化临床数据:行列结构明确,内容可经计算机识别整理、有效存储及处理运用,但仅占所有数据的20%。而高达80%的非结构化临床数据:本身无规范结构、内容复杂,往往不能被计算机使用,比如医生手写笔记、病理报告、传真或是扫描记录等。
有人说,人类最多开发使用了自己大脑容量的10%,要是能利用剩余的90%,人类的洞察力和成就将会无比惊人!与这种逻辑相似,如果能有效利用上那80%的非结构化临床数据,效果可想而知。
得益于存储技术进步、芯片承载能力及医疗资源压力增大等,AI在医疗领域的应用成为资本追逐的热点。如何利用AI解密非结构化临床数据?我们且看医疗初创公司Mendel.ai的答卷。
Mendel.ai成立于2017年,总部位于加利福尼亚州圣德赛。作为一家临床AI平台供应商,Mendel.ai主要服务于RWD(真实世界数据)/RWE(真实世界证据)供应商、制药公司、CRO(医药研发外包服务机构)等生命科学研究站点。Mendel.ai专注于运用AI云端解决方案规范医疗记录,将非结构化EMR(电子病历)数据和临床文献转换为业界最全面、最合规的分析就绪型数据,助力医疗保健系统更好地进行患者护理和临床科学研究。
Mendel.ai董事长兼首席执行官KarimGalil,毕业于艾因·沙姆斯大学医学院,并获外科学博士学位。他是埃尔德默达什医院的一名医生,在诊治病患的过程中,他厌倦了凌乱的医疗记录。Karim一直希望能创建一个有组织的人工智能系统,帮助临床专家为患者提供更好的诊断、治疗方案。
Mendel.ai创始人兼首席技术官WaelSalloum,毕业于哥伦比亚大学,并获计算机科学博士学位。在创建Mendel.ai之前,他就在互联网医疗领域颇有建树。专业技术方面,作为MedTools的首席科学家,他曾开发过一个针对医疗设备信息的可扩展语义实时搜索引擎、构建了OntoLogic并在此基础上创造了医疗设备本体。在EMR.ai公司任职时,他从零开始建立了NLP(自然语言处理)部门、技术和代码库。他所构建的NLP组件,能够格式化文本、预测标点符号、预测报告结构、识别序言文本并从中提取元数据等。在团队管理上,他曾管理过十几名开发人员组成的团队,并一起构建了许多面向医生的服务。
在他们的第一次会面中,Karim表示,他希望每个临床专家身边能有一个“Jarvis”—一个可以扫描所有患者记录并帮助他们更好地为患者提供个性化护理的AI助手。令他惊喜的是,Wael说他自2005年以来一直在研究相关的临床数据AI解决方案。两人一拍即合,开始创建Mendel.ai。
领导团队专业的学科背景和丰富的从业经验,为Mendel.ai的向好发展注入了力量。
医疗数据+AI应用风口,机遇痛点并存
医疗行业的数据呈现出多源异构的特点,这使得数据质量问题在医疗行业表现得尤为突出。如何将电子病历中的非结构化数据转化为计算机可以识别的结构化数据,是发挥大数据分析效能、促进机器学习方法在临床应用的数据基础。
除了最耗时耗力、最原始的人类手动抽象,当前已有研究人员利用自然语言处理技术处理非结构化文本,构建病历智能分析系统的研究。随着真实世界研究的兴起,已经有众多医疗AI公司利用医疗大数据来完成评价医疗实践过程、治疗模式、病人迁徙、疾病特征、患者依从性、疗效评估、患者预后等各方面的真实世界研究。
尽管大数据背景下数据提取、清洗、应用技术快速发展,但由于临床研究过程中数据需求的特殊性,即对数据准确性的高度要求,现阶段医疗大数据应用还是广泛存在数据结构化水平低、患者隐私保护、数据挖掘浅显、应用薄弱等问题。
Mendel系统多产品协同
Mendel系统有针对性地就现阶段医疗大数据的一些挑战开发了自己的系列产品。
▶ 数据结构化
Mendel系统正在致力于识别所有形式的原始数据(包括实验数据、医师记录、扫描文件、医药处方、成像报告、手写笔记、DICOM元数据、ICD/CPT编码等)为文本,最后进行事实提取或将数据组织成计算机可读和分析的格式。
由于LUECINE,UMLS,Fasttext和BioBERT等开源技术无法实现所有形式数据识别,Mendel系统从头开始构建AI,将深度学习与向人类临床专家学习结合。研究人员无需额外调整或培训,就能利用MendelResearch搜索引擎创建高度自定义的搜索查询,Mendel Research给出准确答案的同时训练自己的集成数据库。
临床数据抽象产品MendelRead在丰富的集成数据库基础上,就能扫描原始数据形成结构化文本。它的突出特点是能捕获丰富的细节,如生物标志物、性别、恶性肿瘤类型,这些都是被大型科技AI公司错过的。MendelRead在结构化数据的同时添加了深度临床背景,其产出由临床专家团队审查和验证,以确保数据输出准确性。并且它能提取业界全面和可定制的数据元素列表,以构建具代表性的患者旅程模拟。
▶ 患者隐私保护
在报告中期将PHI(个人隐私信息)与临床信息区分开来非常困难,并且可能导致有价值数据丢失或合规风险。MendelRedact是唯一一种经独立第三方统计验证后符合HIPAA标准的自动PHI去识别解决方案。MendelRedact在本地安装后经优化,可在本地服务器上运行。无需繁重的硬件要求,MendelRedact能确保整个强大的数据提取过程中患者隐私信息永远留在服务本地。
深度数据挖掘
标准OCR(文字识别)引擎通常为理解日常语言而构建,未能捕获临床生物标志物、性别、恶性肿瘤类型等基本元素。相比之下,从头开始构建和训练的MendelRetina,数据捕获速度提高了4倍,错误率降低了4倍,能避免患者旅程不完整的下游挑战。MendelRetina保留了原始数据中每一个可能的表达,只为获得最丰富、可分析、随时可用的患者旅程数据,为突破性见解做好准备,最终实现个性化患者定制研究输出。
广泛数据应用
MendelRecruit是一个旨在加速患者预筛选、注册和可行性评估的AI解决方案。它能读取所有类型的书面患者记录,每日刷新患者数据与世界上全面的试验数据库进行临床试验实时匹配,以自动执行患者预筛选过程。
在数据共享和利用管理上,合作伙伴研究网站联盟为Mendel实时更新超过200万份患者纵向记录。据此MendelEnrich能为研究人员提供实时临床数据源,研究人员只需选择数据端点,即可获得Mendel Enrich分析就绪的CSV或SaaS文件。
医疗大数据市场前景
2022年4月21日,临床人工智能和自然语言处理平台Mendel.ai宣布完成4000万美元B轮融资,本轮融资由OakHC/FT领投,现有投资者DCM跟投。本轮融资资金将用于扩大其AI工程师团队和商业组织规模,还将有助于加快公司新突破性产品Resolve的发布。“我们筹集的资金证明了强大的市场契合度和需求,”Mendel.ai联合创始人兼首席执行官KarimGalil说。“我们的愿景是将Mendel系统融入每个医疗保健数据平台的结构中,使医疗保健系统为患者提供更好的护理。”
IDC(国际数据公司)研究报告显示,2020年中国医疗大数据解决方案市场规模为12.0亿元,同比增长25.7%,预计未来几年中,该市场将持续保持高速增长势头——2020至2025年的年复合增长率为24.3%。作为世界第一数据资源大国,中国无疑将成为AI医疗应用的中心之一。
但目前制约中国健康医疗大数据发展的壁垒和难点也很多。从医院层面,存在数据多源异构难汇集、医疗大数据的标准体系建设未达到应用级水平、缺乏大数据处理和AI技术进行后结构化和自然语言处理,无法有效利用大数据等问题;从政府层面,需要逐步将医疗大数据作为战略资源进行储备;需要实现数据共享;政府需要有效的监管和决策的平台、工具等。