LinkedIn开源Dagli 一个Java机器学习库 紧致全脸?麦吉丽生物质石墨烯面膜如何? 东阿阿胶牛年迎牛市 绅喜天“绅”不凡全国巡回沙龙,传递品牌力量,助力创业梦想 中海达投资:目前已有上千万份爱心捐赠,资金总量庞大 每个FLAG都是大事件,2021还有比遇见欧拉更治愈的事吗 私塾家以AI+大数据科技力量 赋能合作校区升级在线化晚辅 多批次进口食品乳清粉检出核酸“阳性” 进口奶粉是否安全? 大鹏教育美术学院,人生多晚都可以学习! 亚马逊新鲜杂货店嘲笑实体零售的未来 AWS发布模型和数据集以帮助预测当前局势的传播 苹果和索尼都举行了关于购买播客Wondery的谈判 谷歌和沃尔玛的PhonePe受到印度限制部分数字支付参与者的打击 农村宽带普及率低 固定宽带接入提供增长空间 Facebook因不正当行为关闭了数十个缅甸页面 印尼人收集旧手机来帮助学生上网 AWS宣布在海得拉巴开设第二个AWS区域 如何设置和使用WhatsApp Pay 您需要了解的所有内容 以太坊2.0下个月上线 您需要了解的有关下一代区块链的所有信息 YouTube频道靠广告赚钱 会员资格放大特朗普投票舞弊的说法 WhatsApp Pay现在可用于印度的所有用户 EA与里尔菲尔德IMG学院合作将Madden电子竞技带入2500个校园 86%的美国用户表示语音技术可以使活动更卫生 Scopely以33亿美元的估值筹集了3.4亿美元 原因是大流行期间手机游戏蓬勃发展 人力资源经理如何在大流行中帮助提高生产力 安全性以及更多功能 Outrider筹集了6500万美元用于使仓库和配送中心自动化 梅赛德斯的目标是进化 而不是自动驾驶汽车革命 英特尔地理空间是用于A​​I图像分析的云平台 Microsoft Teams日活跃用户超过1.15亿 微软报告2021年第一季度收入为357亿美元 研究人员开发了句子重写技术来愚弄文本分类器 亚马逊印度与HP Gas合作预订LPG气瓶并付款 Facebook推出新计划以帮助印度的中小型企业 Snapchat现在允许创建者显示其订阅者数量 微软更新了iOS和Android上的待办事项应用程序 由于美国大选错误信息在网上传播 Twitter和Facebook暂停了一些帐户 YouTube帐户将数以千计的实时伪造选举结果直播 Airtel的Nxtra投资1750亿卢比来扩大在印度各地的数据中心 腾讯加入特朗普禁令以保护数据 绅喜黑巧胶原蛋白营养棒,解锁健康潮流新方式! ZFX山海证券来科普经纪商为什么会出现滑点、卡盘、交易延迟 阿卡索以总额近10亿元C轮融资为新起点,开启大众英语教育市场新时代 多地倡议“就地过年”,商家入驻点购广场转型升级应对“大浪淘沙” 春雨慈善基金会铸爱心促发展座谈会在合肥康华康复医院召开 霜巨人工作室为即时战略游戏复兴筹集了470万美元 精灵将让消费者使用Giphy和Gucci创建自己的3D化身 Instagram直播现在可以进行4小时 研究发现谷歌在选举阴谋论网站上投放广告 苹果收购自学AI视频初创公司以改善应用程序 微软对云计算需求旺盛的销售最高预期
你当前位置:首页 >资讯 >

LinkedIn开源Dagli 一个Java机器学习库

2021-02-02 15:41:24来源:

如今,LinkedIn开源了Dagli,这是一个用于Java(和其他JVM语言)的机器学习库,表面上使它更易于编写抗错误,可读,可修改,可维护和可部署的模型管道,而不会招致技术性负担。

Algorithmia在2019年进行的一项调查发现,虽然企业中的机器学习成熟度通常在增加,但大多数公司(50%)花费8至90天的时间来部署单个机器学习模型(其中18%的时间超过90天)。大多数人将责任归咎于无法扩展规模,其次是模型可再现性挑战,缺乏执行人员支持以及工具差。

对于Dagli,模型管道被定义为有向无环图,该图由顶点和边组成,每个边从一个顶点指向另一个顶点,以进行训练和推理。Dagli环境提供管道定义,静态类型,几乎无处不在的不变性以及其他功能,可防止大多数潜在的逻辑错误。

LinkedIn自然语言处理研究科学家Jeff Pasternack在博客文章中写道:“模型通常是集成管道的一部分……并且构建,培训和部署这些管道以进行生产仍然比原本要麻烦得多。”“经常需要重复或多余的工作来适应训练和推理,从而产生易碎的“胶水”代码,从而使模型的未来发展和维护变得复杂。”

Dagli在服务器,Hadoop,命令行界面,IDE和其他典型的JVM上下文中工作。大量的管道组件可以立即使用,包括神经网络,逻辑回归,梯度增强决策树,FastText,交叉验证,交叉训练,特征选择,数据读取器,评估和特征转换。

对于经验丰富的数据科学家,Dagli提供了一条可长期使用,可维护和可扩展的高性能,生产就绪型AI模型的途径,可以利用现有的JVM技术堆栈。对于经验较少的软件工程师,Dagli提供了可与JVM语言和工具一起使用的API,旨在避免典型的逻辑错误。

Pasternack继续说道:“借助Dagli,我们希望使高效,易于生产的模型更易于编写,修改和部署,避免了技术债务和长期伴随的长期维护挑战。”“ Dagli充分利用了现代的,高度多核的处理器和…强大的图形卡,可以对实际模型进行有效的单机训练。”

Dagli的发布是在LinkedIn启用LinkedIn Fairness Toolkit(LiFT)之后发布的。LinkedInFairnessToolkit(LiFT)是一个开放源代码软件库,旨在支持AI和机器学习工作流程中的公平性度量。在LiFT之前,LinkedIn首次推出了DeText,这是一种用于自然语言过程相关排名,分类和语言生成任务的开源框架,该框架利用语义匹配,使用深度神经网络来理解搜索和推荐系统中的成员意图。