导语:打造AI数据服务“共享模式”
AI的发展离不开大量数据的训练,就目前看来,行业内从事算法开发、产品研发的公司要么自己研发组建数据采集、标注工具和团队,要么由数据服务公司建立数据工厂或进行众包的模式满足数据需求,这两种模式要么无形中增加了开发成本,要么使得数据需求在中间传递过程中模糊化,有没有一种模式,可以直接让数据需求方直面数据采标方,又不增加开发、运维成本呢?数据采集标注行业领航者——龙猫数据,最近给出了他们的答案。
AI兴,日新月盛
从《终结者》和《模仿游戏》等科幻电影开始,到阿尔法go战胜李世石,再到无人超市的兴起,“人工智能”一词被提及的频率越来越高,人们对人工智能的关注度也愈发高涨。不仅公众对人工智能改变生活高度好奇,各行业人士也迫切希望能将人工智能应用到他们的工作中。
根据中国信通院数据研究中心ICT检测平台实时监测的数据,截至2018年上半年,在全球范围内共监测到4998家人工智能企业。其中,美国2039家位列全球第一,其次是中国1040家。2019年美国总统特朗普签署行政令,启动“美国人工智能倡议”,旨在从国家战略层面调动更多联邦资金和资源用于人工智能研发,以应对来自“战略竞争者和外国对手”的挑战,确保美国在该领域的领先地位。
2017 年 7 月,国务院发布了《新一代人工智能发展规划》(AIDP)。这份文件与 2015 年 5 月发布的《中国制造 2025》构成了中国人工智能战略的核心。
吴恩达将深度学习的发展形象的比喻成建造火箭,数据是燃料,算法是引擎,任何算法的实现都离不开数据的支持。据统计,目前专业从事数据采集标注的较大规模公司有50余家,为此服务的小规模渠道商则多达几欠家,专业从事数据标注的的人数已超过十万,兼职人群的规模更是接近百万。
传统方式or自主采标?成本高成为企业之痛
人工智能公司的总支出中,有20%-30%用于数据支出,这一数字还是在严格把控成本的基础上才能实现的。现阶段大陆市场数据采集及标注的规模保守估计有五十亿,而基于目前主流人工智能发展趋势分析,基础服务特别是数据服务将在未来5-10年内继续发挥重要作用。但是产业的繁荣不能代表模式的成熟,特别是目前数据服务业一刀切的服务模式,对于日新月异的AI产业发展形成了一定程度的限制。
首先,中小型创业公司、高校和科研院所和某些大公司实验性AI项目,对于AI数据的需求与大公司有着诸多不同,他们所需要的可能只是少量的常见类型数据,如果以传统模式为其服务,通过数据定制的方式在数据服务公司解决数据需求,无疑会提高他们开发成本,对相关项目发展形成桎梏。
其次,某些团队希望有自己的采标人员,使用自己研发的数据采标系统,这样做企业或许觉得随时调用灵活方便,但是简单的算一笔账就知道这有多不现实。目前组建一支20人左右的采标团队,以每人每月5000元工资计算,加上管理费等其他人力成本支出,每月的支出在20万以上。而要想拥有一套能用(且不说先进和完备)的数据采标系统,加上质量管理、流程控制等功能,开发成本则至少是80万。
除此之外,AI的发展也是“唯一的不变就是变化”,一旦有了新类型的数据需求,原来的采标人员则需要重新培训、筛选,原来的采标系统也需要更新迭代;一旦有了数据标注任务量上的变化,企业要么需要裁减标注人员,降低成本,要么需要增加人手,带来极大的管理成本。
总之,AI企业迫切需要一种新模式改变目前被动状态,实现低成本数据采集标注,这一次,龙猫数据给出了他们的“0成本”方案——龙猫数据采集标注开放平台。
龙猫数据开放平台:直面用户深入人心
作为行业内引导企业,龙猫数据一直走在变革的最前沿,因为他们明白,只有不断变革,才能带来生产力的大发展,才能为行业带来新变化、新机遇。最近即将上线的龙猫数据采集标注开放平台,是集数据采集、标注于一体的一站式自助服务平台,可以为企业提供完备的采集、标注工具集,海量的专业采标团队,支持企业自主定价。企业发布的任务全程可视可控,7*24小时极速满足数据需求。
开放平台拥有快速响应机制,7*24小时极速响应需求,借助500万注册用户,2000+专业团队,以及咨询顾问全程跟踪,可以实现为企业快速配置个性化任务流,从此企业再也不用担心人不够用、人不好用,企业数据采标人力管理成本变为0。
在开放平台上,企业可以直接发布任务,对需求理解更透彻,数据质量也更高;直接对接采集、标注用户,省去中间环节,企业自主定价,仅此一项便可减少成本支出30%以上。
开放平台拥有全面的通用型标注工具,包括超像素分割语义处理系统、ASR语音标注系统、NLP自然语言处理系统等,可以实现语音波形图展示、无缝时间戳选取,图像与自然语言精准标注,满足各种数据类型需求,龙猫数据还将会进行系统维护和升级迭代,而这一切的成本——也是0。
平台的任务流系统拥有成熟的自动化流程,网页端、客户端、移动端互联互通,多平台协作保证效率最大化,同时任务全程可视可控,减少了人为干涉成本产生;任务流支持串并行,多工序项目流程合理配置,多团队分发管控,配合龙猫数据专业任务流拆解经验,利用上百套成熟模板积累,一步达成数据需求最优解。
目前,平台可以实现的功能主要有——1 数据采集:涵盖文本、图像、语音、视频等多数据类型;2 数据标注:标注平台利用智能化处理对标注数据进行加工,可以处理视频、图片、音频、3D点云等多样化数据;3 数据质量管理:自动审核、交叉审核、可视化验收,自动生成抽检文件夹,采集标注准确度直观可见;4 采标人员管理:500W注册用户,2000+专业渠道随时调用,灵活高效的用户管理系统为任务完成提供支持;5 便捷任务管理:可方便快速配置的任务管理中心,提升任务管理效能;6项目进度监控:项目完成情况实时可见,合理把握项目完成时间,控制成本支出。
加入简单,轻量级采标大受欢迎
与一些企业自建团队、系统“做重”不同,龙猫数据开放系统明显是在“做轻”,通过企业自助的形式加入,轻松满足企业数据需求。当然,面对一些量级特别大、难度特别高的数据需求,龙猫数据依然会采取定制化服务,提升客户需求满足效率。定制化服务与开放化系统相得益彰,互为补充,最终形成数据服务闭环,分层次满足企业AI数据服务需求,这就是AI数据领域的“龙猫打法”。
目前龙猫数据采集与标注开放系统加入相当简单,只要完成注册充值,即可在线自主定价发布任务,完成验收后剩余余额还支持随时退回。除此之外还有专业顾问经理全程跟踪,一对一答疑解惑,无论是系统应用上的问题,还是需求拆解的问题,龙猫顾问都将基于几年的服务经验,做出令人满意的解答。
龙猫数据将一如既往为客户精诚服务,助力AI产业,筑基智慧生态,筑梦美好未来。
相关报道:
- 行走在“头腾大战”最前沿厮杀的,是一群撕掉标签的90后 2019-01-21
- 从白名单到基础定价,数据服务流程化对AI有多重要? 2019-01-18
- 龙猫数据:变革数据生产方式 打造高效便捷的服务平台2019-01-09
- 创新引领发展,龙猫数据用新技术赋能AI赢取未来2019-01-09
- 数据服务:AI领域的“菊与刀” ——企业破解数据服务行业“约拿情结”的探索2018-11-08
要闻推荐
今日视点
热点专题
新闻图片
- 新闻排行
- 评测排行