UWaterloo将研究椅添加到数据清理中


【UWaterloo将研究椅添加到数据清理中】随着企业试图从他们收集的每一点数据中挤出更多的数据 , 确保来自各种来源的数据是一致的 , 对于避免重复和帮助机器处理至关重要 。
为了帮助扩大在这一领域的业务和法律新闻方面的知识 , 汤森路透(Thomson Reuters)正在通过资助一个数据清理研究讲座来扩大与滑铁卢大学的关系 。
他的工作包括研究新的方法来存储、清洗和保存数据 。通过担任研究主席 , 伊利亚斯将继续专注于整合和管理数据 , 以克服数据筒仓的问题 , 并帮助企业更好地利用其数据 。
汤普森路透社滑铁卢实验室(Thompson Reuters’WaterlooLab)主任祖伯特(Brian Zubert)表示 , 这位研究主持人是该公司和该大学已经开始构建非结构化数据工作的延伸 。这个有着一年历史的实验室是世界上三个TR中的一个 , 其他的在伦敦和波士顿 , 今年还有两个 。
一些公司数据集是“肮脏的” , Zubert解释说-例如 , 文本可能将微软称为MS , 或者使用“U”作为“你”的速记 。这是一个特殊的问题 , 在旧数据库中 , 数据字段比今天短 , 用户不得不使用缩写 。
云允许非常简单的可伸缩性 。但在我们扩大规模之前我们需要考虑一些问题...
在解释数据质量时 , 行业顾问DaveWells喜欢用几个小时的电池进行类比 。
他说 , 机器处理数据必须结构良好、干净、一致和准确 , 否则用户就不可能做出决定 。“准确性变得格外重要 , 这就是像这样的研究不仅在汤森路透(Thomson Reuters) , 而且在我们的客户中真正发挥作用的地方 。
这是两家机构周三宣布延长合作关系的几项声明之一 。其他举措包括:
·路透社(Thomson Reuters)正在提供一项软件许可证交易 , 以便滑铁卢数学学院及会计和金融学院的600多名学生和研究人员能够使用其Eikon金融市场交易平台 。祖伯特说 , 这个平台将使学生有机会将金融理论应用于实践;
·与问题实验室(Problem Lab)合作 , 这是一个由滑铁卢经济学系和康拉德中心的作者兼副教授拉里·史密斯(Larry Smith)管理的新项目 。问题实验室帮助学生发现和理解现实世界的问题 , 这可以帮助那些想要创建初创企业的人;
在TR滑铁卢实验室将为大学本科和研究生提供四个职位(三个合作项目:UX设计、数据科学和创业参与 , 以及一个博士实习:数据科学) 。此外 , 它还将为硕士或博士研究生创造一个全职职位 。
所有这些都增加了TR和Uwaterloo在电子发现研究方面的合作 , 并帮助硕士课程的学生 。
除了在滑铁卢的实验室外 , 汤森路透最近还在多伦多开设了一个认知计算中心 , 扩大了在加拿大的研发业务 。它现在正在寻找经验丰富的数据科学家和技术研究人员 。
祖伯特说:“通过从大学早期层次上挖掘一些最聪明的人才 , 你可以建立自己的人才管道 , 同时帮助提高学生在学校期间的技能 , 这样他们就能在你想全职雇用他们时得到你所需要的东西 。

    推荐阅读