禾连健康CDO沈金:谈云时代的大数据平台架构

2017/04/13 21:29
阅读数 47

11+大数据行业应用实践请见https://yq.aliyun.com/activity/156,同时这里还有流计算、机器学习、性能调优等技术实践。此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps;更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data 。

 

禾连健康通过为医院提供无线WIFI网络解决方案作为切入点,让医护和患者在享受高速上网服务的前提,为医护提供提升工作效率的工具,为患者提供健康服务的内容,同时作为国内领先的医院流量运营者,为医药行业提供精准营销服务。在禾连健康,大数据主要被用作在精准营销和内容服务两个部分,一方面为利用大数据做医院流量的精细化运营,另一方面利用大数据在互助问模块道实现自动化问答,从而降低用户获取信息的成本。

 

近日,笔者有幸与禾连健康CDO沈金进行了简短的交流,就大数据技术架构方面进行了简单的探讨。

 

以下为实录:

 

YQ:请介绍一下自己?

 

沈金:禾连健康CDO,前阿里云数据服务IDMAPPING负责人,后作为阿里云数据工作室成员入驻云栖小镇,参与医疗大数据的创新,案例:“云上安心”、“安心跑”。

 

YQ:在大数据实践的过程中,你们业务场景中的主要挑战有?

 

沈金:广告营销团队面对的是国内各种医药保健行业的客户,这些医药客户有非常明确的人群需求,母婴类客户和肿瘤类客户需要是完全不一样的人群,如何有效区分流量,高效利用流量一直是个难题,再加上对于人群的区分需要考虑在医院的就诊轨迹,结合挂号信息,网络访问URL和搜索行为进行完善补充。历史的解决方案是其他云 + 自建HADOOP,这里主要存在的问题有:维护——没有专人维护、开发任务比较繁琐;费用——在同样的满足性能情况下,阿里云明显费用低,只有以前的1/3。

 

YQ:阿里云数加的哪些特性帮助你们解决了这些问题?你们所使用的服务有?数加给贵公司带来了哪些收益及业务价值,能否通过一些数字阐述?

 

da735852f88213d6679a4a7359eaa5f25aad9443

 

沈金:利用MaxCompute的离线计算能力和PAI在文本挖掘上的能力,帮助我们能快速解决如细分疾病历史人群的问题,利用DataHub和StreamCompute的实时计算能力能帮助我们

解决如何细分在线人群的问题,通过离线圈人和实时圈人使我们在精准营销方面,广告的点击率提升了3%。

 

YQ: 贵公司大数据解决方案是什么?可否进行简单描述?

 

8ac232021d17cfaff0575b8ec067b3d007530b9a

 

沈金:

  • 离线计算:RDS/MongoDB->Datax->MaxCompute(PA)
  • 实时计算:ActiveMQ->DataHub->StreamCompute
  • 日志收集:MongoDB(目前正在尝试SLC)

 

YQ:当初是什么原因促使您选择阿里云数加产品的?

 

沈金:能快速帮助企业搭建稳定便捷的大数据处理基本能力,而且成本也相对较低。

 

YQ: 对比云服务和自建大数据基础设施,你们是怎么衡量的?

 

沈金:自建维护成本太高,对数据存储和计算框架未来会越来越普遍,会作为一种基础能力,不想投入大量精力。

 

YQ:你们未来还想借助大数据实现的场景有?阿里云数加是否能满足你们的需求?如果没有,期待有哪些?

 

沈金:语音识别,智能问答。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部