电脑之能,是电脑之心母公司高度关注亚洲地区人工智慧产业应用领域情景及商品化的内容帐号。热烈欢迎高度关注与交互:almosthuman2017

作为夏普我国在我国人工智慧应用领域领域抛出的首家子公司,码隆信息控制技术的控制技术商品到底如何?未来将把该笔股权融资应用领域在何方?黄鼎隆得出了标准答案。

发表文章 | 高玉兰

11 月 10 日,亚洲地区著眼于广度自学与计算机系统听觉控制技术的创业者子公司码隆信息控制技术(下简称码隆)宣布赢得来自夏普我国资本B轮的 B 轮股权融资,股权融资数额总计 2.2 亿港币。在此之前,码隆信息控制技术曾在 2015 年 3 月赢得 1200 万进水口股权投资,于 2016 年 10 月完成 6200 万港币 A 轮股权融资。

对于接下去的拓展方案,码隆信息控制技术 CEO 黄鼎隆说:「最重要的是右军地招引 AI 专业人才,进一步完善项目重新组建设,其二是子公司正在拓展包括美国、日本、以及中美洲等海外消费市场,将把该笔资金用于加快多元化消费市场的拓展。此外,子公司还方案重新组建自己的网络系统,加大硬体各方面的投入。」

更为重要的是,这是夏普我国在我国人工智慧应用领域领域抛出的首家子公司。在此之前,夏普我国曾成功股权投资了亚洲地区的腾讯、淘宝等一系列项目,并从去年已经开始,著手在亚洲地区范围内小规模股权投资人工智慧应用领域领域。夏普我国顾问投资顾问宋飞云认为,码隆拥有世界顶级专业人才项目组及多元化视线,看淡和期盼接下去子公司在多元化产业布局各方面的重大进展。

另一家被夏普我国火速瞄准的我国人工智慧孵化器子公司,在控制技术和商品各方面又有什么样不足之处?有鉴于此,电脑之能专访了黄鼎隆,对另一家子公司一探到底。

广度自学是关上铁矿的一把锁匙

2014 年 7 月,黄鼎隆和他的「铁三角」码特(Matt Scott)已经开始创业者,富尔县了各别英文名字中的一个字,将子公司重新命名为码隆信息控制技术。

这并不是二人的首次合作。7 年前,黄鼎隆和码特还是微软同事,联手开发了必应词典,这也是微软在亚洲最成功的互联网商品之一。黄鼎隆负责商品与消费市场,码特负责研究与开发,当年的分工延续也一直到现在。

码图网(图码是什么)-第1张

码隆信息控制技术CTO码特与CEO黄鼎隆

「当时这个商品成功走通了从研究开发、商品消费市场到销售变现的整个闭环。」黄鼎隆笑着说道,「所以那时我们就有过这种内部创新的经历,只是工资不用我们自己发而已。」

创业者的想法是从必应词典的研发已经开始。当时流行的词库还只拥有百万量级的词汇量,而必应词库就火速实现了千万量级的词汇量,这背后,项目组在挖掘和抓取互联网上的中英词汇文本信息各方面付出了大量精力。「我们发现,很多互联网信息有很大价值,图像就是一个未被开采的巨大铁矿。我博士研究方向是人机交互,也非常高度关注基于听觉的项目。可惜那时候,控制技术还达不到现在这样的水平。」黄鼎隆说道。

直到 2014 年,广度自学火花溅起,解决图像问题的控制技术手段愈发成熟。黄鼎隆意识到,之前所留意到的图像铁矿已经开始有机会被挖掘出来了,广度自学控制技术正是关上这个宝库的锁匙。「这是一个很好的方向,我们一拍即合,决定义无返顾地去创业者。」黄鼎隆说。

在基于广度自学与计算机系统听觉控制技术进行探索的道路上,码隆信息控制技术选择聚焦在商品识别应用领域领域,并将这一定位从成立贯穿至今。而著眼于细分方向并建立足够的护城河,也是吸引夏普我国B轮 B 轮股权融资的重要原因之一。

开发弱监督式自学方法,跨越真实情景中的数据难题

商品识别,也就是让计算机系统像各个行业的专家一样识别出各种商品,比如像零售业专家一样认识各种品类的快消品,像时装设计师一样根据图片掌握、分析各种时尚信息。3 年来,子公司把商品识别深入覆盖到纺织、时尚、图像版权、家具、医药、营销等多个垂直行业。

码图网(图码是什么)-第2张

需要一提的是,识别商品与识别物体不同,不仅要知道识别的对象是什么,还要从不同的维度理解识别的对象,例如商品的各种属性,包括风格、颜色、材质、面料等。除此之外,不同应用领域情景下的商品也有具体不同的特性。

「我们遇到了两大控制技术难点,」黄鼎隆表示。

项目组在研发过程中发现,有许多商品是柔性的,会随着外界影响发生形变而且没有固定的特征。很明显,相比五官特征有规律的人脸,衣服形态特征差异巨大,比如被穿在身上、平铺在桌面以及揉成一团的时候,训练所需的特征都不一样,给识别带来的挑战极大。为了提高识别力,项目组采用广度自学控制技术,训练计算机系统自己自学如何进行识别。

但与此同时,第二个问题也随之而来——用于模型训练的商品数据往往是「不干净、不均衡」的。

众所周知,对有监督自学来说,标准数据至关重要。但无论是从互联网上抓取到还是由企业提供的商品数据标签,可能并不准确。另外,一些商品数据较为稀缺,会产生数据不平衡的问题。为改善有监督自学效果,码隆信息控制技术开发了一套弱监督式自学方法,能够有效利用含有「噪音」——也就是不规整的数据,并且基于此训练出一个能够与人类媲美的 AI 模型。

码图网(图码是什么)-第3张

为了验证这个方法,码隆信息控制技术在今年 7 月参加了 CVPR (IEEE Conference on Computer Vision and Pattern Recognition,IEEE国际计算机系统听觉与模式识别会议)的 WebVision 竞赛。WebVision 被誉为接棒 ImageNet 的图像识别竞赛,主要区别在于其数据集直接从互联网上抓取,没有经过人工标注,含有大量的噪音,而且不同类别的数据量十分不平衡。这种更贴近于真实应用领域情景的数据环境,使得比赛的挑战难度也更大。码隆信息控制技术利用自主研发的弱监督式自学夺得冠军,并且大幅度领先第二名。

「在 ImageNet 这种理想化数据集上的提升已经基本接近于极限值,近几年内也没有出现太过创新的算法,更多是把比拼放在在算力各方面。我想这也是 WebVision 提出不干净、不平衡数据的原因,需要有新的算法出现。」黄鼎隆补充道,「无监督自学是一个美好的未来,但在短期内全世界范围还没有看到一个可行的方案。所以在这种情况下,弱监督式自学是最佳的落地方案。」

聚焦三大应用领域领域,积极拓展应用领域平台

不过,任何商品的商业落地都是一个系统工程。控制技术之外,找到行业中的真实需求,然后定义好这个问题本身才是控制技术落地的关键。

码图网(图码是什么)-第4张

码隆信息控制技术的办法是搭建一个普适性的自助式人工智慧应用领域平台 ProductAI,让不同行业的客户用更简单高效的方式使用其控制技术方案。另一各方面,码隆优先选择人工智慧、计算机系统听觉控制技术应用领域价值较大的应用领域领域,也就是所谓的头部行业,尝试与这些应用领域领域内的客户广度结合,挖掘他们的真实需求,最后提供一个端到端的解决方案方案。

这是黄鼎隆口中的「一横一纵」策略,横向基于 ProductAI 平台不断向外拓展,纵向则将商品与各垂直行业需求紧密结合,为企业提供端到端的解决方案从而这些帮助行业上百倍地提升效率。

当然,在挖掘行业需求的过程中不可避免地会出现一些「伪需求」。曾有一个子公司想用 AI 控制技术来解决穿衣搭配问题,让电脑从那些时尚博主、明星的穿搭经验中摸索出规律。码隆项目组琢磨之后,明确这种应用领域算不上真正的「刚需」,提出以图搜图的方案。因为搭配效果是落在图片上,明星街拍照片、社交媒体上点赞较多的穿搭图片已经非常直观,只需要用以图搜图的方式找到某一件单品都在什么图片中出现过,就可以帮助用户解决搭配的问题。相较于文字这种需要用户消化理解的形式,图片反而更加简洁清晰,也就是所谓的「一图胜千言」。

码图网(图码是什么)-第5张

码隆信息控制技术与穿衣助手合作,让消费者可以通过搜索服饰照片,找到对应的服装搭配推荐

根据码隆的说法,自 2016 年 10 月发布至今,ProductAI 平台上的企业客户累积超过 200 个,并与我国纺织信息中心、京东商城、唯品会、卷皮、可口可乐、优料宝、家图网等合作,商品识别覆盖超过 20 多个垂直应用领域领域,能够在各应用领域领域的图像中找出图中所包含的商品并得出多达 20000 个以上的标签。在服装属性识别各方面,ProductAI 的标准准确率甚至超越人类相关专家的水准。

目前,子公司核心业务聚焦在服装纺织、家居家装以及新零售三个应用领域领域。其中,服装纺织是码隆信息控制技术 2014 年创业者之初最先切入的应用领域领域,已经已经开始积极拓展海外消费市场。

「眼下人工智慧的发展还处于早期阶段,真正的大机会其实还没有出现。我们会一直著眼在商品识别方向,这是一个很大的空间。」黄鼎隆说。