机器学习:连接统计学和IT
如何处理来自多个数据源的数百万个需要分类的数据点, coded, and analyzed? 实时地? 而且预算紧张? 编码和分类可能需要数年时间才能完成. 更不用说成本了. 机器学习提供了解决方案.
通过机器学习,我们可以手动审查和分类可用数据的子集. 然后,我们使用这些子集通过最新的机器学习技术训练系统,以自动编码和分类原始数据. 我们可以随着时间的推移重新校准流程,以处理困难的数据模式和不断变化的需求.
机器学习让我们建立了一个基础设施,可以接收和审查大量数据, 并迅速点, analyze, 并报告趋势.
887700线路检测中心使用先进的方法来解决问题
887700线路检测中心利用统计和IT的力量来解决数据管理的挑战. 我们开发了一种使用自然语言处理的多管齐下的方法, 机器学习方法, 和统计算法. 我们的工具箱采用了神经网络和支持向量机方法, 潜在语义索引, 以及其他先进的统计方法.
良好的预后处理医院调查资料
在处理大规模纵向数据时,机器学习是一个很好的工具. 例如,一项提供全国住院病人护理数据的调查. 韦斯特公司每年为这项调查收集数百万份医疗索赔记录. 数据是通过一个安全网站发送给我们的.
使用机器学习, 我们开发了一个系统,根据记录内列出的付款人姓名,自动将付款人类别分类:
- 我们建立了字典来将原始数据预处理成可用的输入.
- 我们用预处理后的数据对系统进行训练,并用得到的“模型”对新数据进行编码.
- 我们建立了一个数据管理的基础设施来进行审查, check quality, annotate, 和更新的结果.
我们的系统已经处理了数千万条记录, 以前需要高强度体力劳动的东西. 我们还开发了一个系统来简化数据质量控制,从而减少了80%的人工审查. 这使得数据管理人员可以集中精力解决更困难的数据问题.