新闻资讯

诚美科技简报 第十七期——科技创新及应用资讯

2019-04-18

第一部分 科技资讯

一、人工智能

1、IBM AI辩论机器人不敌人类辩手

美国旧金山当地时间2月11日,曾在去年6月完胜以色列辩论冠军的AI辩手——IBM Project Debater重出江湖,对战2016年世界辩论决赛选手、毕业于牛津大学的Harish Natarajan。
本次比赛在位于旧金山的IBM Think会议上举行。双方围绕“政府是否应该资助学前教育(Whether goverment should subsidize pre-schools?)”进行激烈交锋。
从AlphaGo接连战胜国际围棋冠军,到AlphaStar在星际争霸2将人类对手杀得片甲不留,AI一直在挑战新的高峰,不断刷新战胜人类的历史记录。可惜这一次,AI落败。
不过,如果你以为这个AI系统只是个辩论机器,或者只是个帮助人类补充逻辑思维的工具,那你就有点天真了。这只是IBM宏伟野心刚刚拉开的序幕。
本轮辩论,IBM的AI系统Project Debater为正方,人类辩手Natarajan站反方。在辩论前的投票中,79%的观众同意政府应资助学前教育,即Project Debater所在的正方的观点,13%的观众选择了不同意。
Natarajan拥有大多数辩论赛冠军的世界纪录,参加过三次世界锦标赛,并在2012年赢得了欧洲锦标赛冠军。在得知辩题后,Natarajan快速将思考潦草地记在纸上。

2、OpenAI推大规模无监督语言模型GPT-2

2月15日,OpenAI发表最新博客,表示其研究团队已训练出了一个大规模的无监督语言模型,它可以生成连贯的文本段落,在许多语言建模基准上实现最先进的表现,并执行基本的阅读理解,机器翻译,问答和总结。所有这些都没有针对特定任务的培训。据称,该模型称为GPT-2(GPT的继承者),仅用于预测40GB互联网文本中的下一个单词。

3、DeepMind让AI组队踢足球 AI学会合作

2月22日,DeepMind发布最新研究:证明了在足球环境下,一种基于分布式代理的连续控制培训框架,结合奖励渠道的自动优化,可以实现多智能体端到端的学习。简言之,DeepMind设置了环境,让多个AI一起踢足球赛,并且提前设置了规则,奖励整只“足球队”而不去鼓励某个"AI球员”的个人成绩,以促成整个球队的进步。这证明AI可相互合作。
据悉,DeepMind在github上发布了他们使用的MuJoCo Soccer环境,这是一个竞争协作多智能体交互的开源研究平台,在机器学习社区已经得到了相当广泛的使用。

4、华为MWC发布5G折叠屏手机Mate X

2019年2月25日,MWC期间,华为正式发布了5G折叠屏手机HUAWEI Mate X。Mate X采用无边框设计,折叠前正面6.6英寸屏幕,背面屏幕尺寸是6.38英寸,打开后为8英寸彩屏,屏幕长宽比为8:7,类似于一款8英寸平板,8GB+512G版本售价2299欧元,预计今年6月发售。
Mate X另外一个卖点是支持5G,采用Balong 5000通信芯片和麒麟980处理器。Mate X采用双卡槽设计,4500毫安电池和55W快充

5、达摩院研发AI谣言粉碎机 准确率81%

2月27日,阿里达摩院研发的“AI谣言粉碎机”在SemEval全球语义测试中刷新记录,达摩院NLP首席科学家司罗所属的团队获比赛冠军,真假新闻二分类上的准确率达81%,刷新了本竞赛系列上macro F 、RMSE两项指标的世界记录。
SemEval是自然语言处理领域的国际权威比赛,由国际计算语言学学会举办。假新闻识别是此次比赛的主要项目之一,参与比赛的有哥伦比亚大学、华盛顿大学、艾伦·图灵研究所等20多家院校机构。

6、谷歌面向企业用户推广AI语法检查功能

2月27日消息,据The Verge报道,谷歌宣布将在Google Docs中面向所有G Suite用户默认提供人工智能语法检查器。普通的拼写检查功能会将疑似错误高亮显示,而语法检查器则会使用蓝色曲线来标记可能的错误。谷歌去年7月宣布了这项功能,但当时需要由系统管理员手动开启该功能,所以并没有默认开启。不过这些功能目前仅限于企业用户。

7、菜鸟语音助手入选全球十大突破性技术

2月28日消息,美国科学杂志《麻省理工科技评论》评选出2019年“全球十大突破性技术”,将“流利对话的AI助手”作为今年十大突破性技术之一。菜鸟智能语音助手技术成功入选。2018年12月,该媒体曾发布报道称,阿里巴巴的AI语音助手可以完成复杂的人类对话功能,甚至可读懂人类的潜在意图,显示出阿里巴巴已经拥有比谷歌更好的AI语音技术。这一语音助手可以自动帮快递员给消费者打电话,询问消费者要将包裹放在什么地方,自主完成派前电联。
 

二、区块链技术

1、美国SEC开始审核VanEck比特币ETF提案

据美国证券交易委员会(SEC)2月13日发表的官方文件,SEC开始整理芝加哥期权交易所(Cboe)从1月30日开始征集的VanEck比特币ETF的“公共评论”,并正式对其进行审核。

2、卢森堡通过区块链框架法案

据luxtimes2月14日报道,卢森堡立法者周四批准了一项针对区块链的法律框架,允许通过区块链进行的交易与传统技术完成的交易具有相同的法律地位。60名议员中只有两名左翼政党成员投票反对该法案。该法案去年由财政部长Pierre Gramegna送交立法机构。

3、商务部等12部门发文明确提出要利用区块链等技术促进商品交易发展

2月27日上午,商务部发布了《商务部等12部门发布了关于推进商品交易市场发展平台经济的指导意见》(简称“意见”),明确提出要利用区块链等技术促进商品交易发展。
鼓励商品市场立足平台经济发展,依法合规创新大数据、云计算、物联网、区块链等信息技术应用,强化平台数据整合和资源配置能力……加大对商品市场开展互联网、物联网、大数据、云计算和区块链等信息技术研究与应用支持,引导符合条件的商品市场向高新技术企业转型。 
这是首次 12 部门联合发布的文件中提及区块链技术。

三、AR/VR

1、首档5G实时制作的超高清VR节目开播

2月1日消息,中央广播电视总台于2019年1月31日在新闻频道《我要看春晚》融媒体直播特别节目中实现了VR内容在电视端和移动端同步播出,这是5G技术和超高清VR制作技术首次结合应用于电视节目直播中。此次节目直播选取的是5G信号覆盖较好的2019春晚长春和深圳分会场,构建超高清VR信号采集和传输链路。通过5G接入终端实现无线采集现场多角度的景观信号并实时拼接缝合,然后将超高清VR全景信号通过5G基站及网络传输至北京的总台新闻演播室。

2、华为AR眼镜专利曝光 可嵌入智能手表

2月11日消息,据报道,近日,荷兰网站LetsGoDigital曝光了华为的一项增强现实眼镜专利,最大的特色是能够在上面嵌入智能手表,以便随时调用屏幕和相机。这款“超薄”的增强现实头戴式装置,本身并未配备摄像头、显示屏或麦克风,而是需要通过配套的智能手表来实现(挂在镜腿上)。安装之后,智能手表还可将摄像头朝向外侧,以记录用户的活动。2018年11月,华为CEO余承东在接受CNBC采访时称,该公司正在开发与智能手机配合使用的AR眼镜,其有望在今年年底亮相。

3、IDC发布2019年VR/AR市场十大预测

2月11日,IDC发布2019年中国市场VR/AR市场十大预测:
一、观影一体机VR市场将继续增长。
二、5G网络将带动VR/AR安全巡检市场发展。
三、AI将附能VR/AR设备,65%的VR/AR设备将提供语音技术交互。
四、手机AR内容生态更加丰富。
五、2019年VR游戏市场将增长75%。
六、到2023年,将会有超过十亿人次每年至少访问一个安装VR设备的消费场所。
七、超过30%的展示类场景将通过租赁方式整合提供设备、软件、服务。
八、商用市场权重进一步增长,预计超过1000所学校将采用VR/AR技术。
九、到2024 年,7%的国内企业将以VR应用作为支持推动跨区域协作的解决方案。
十、到2024年,55%的中国大中型企业将为部分员工部署AR硬件。

4、搜狗公司与新华社新媒体中心联合发布了首个站立式AI合成主播

2月19日,搜狗公司与新华社新媒体中心达成战略合作,并联合发布了首个站立式AI合成主播。
新的AI合成主播将从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,这意味着AI在模仿人类声音、唇形、表情的基础上,进一步学习人类的体态、手势等,表现力更加丰富,也代表着“搜狗分身”技术再次取得新进展。
三个月前,在2018年互联网大会期间,搜狗与新华社发布全球首个AI虚拟合成主播。搜狗公司CEO王小川表示,三个月来,首批入职新华社的一中一英两位AI合成主播,已生产3400余条新闻报道,累计时长达10000多分钟,参与了包括第五届世界互联网大会、首届进博会、2019春运、春节等若干重要报道,成为AI与传媒业融合并付诸规模化应用的典型案例。
无论是初代AI合成主播,还是站立式的AI合成主播,其背后的关键技术是“搜狗分身”。

5、微软发布HoloLens 2混合现实设备,售价3500美元,可以按需定制

2月25日,微软在巴塞罗那MWC2019大会上正式发布了HoloLens 2混合现实设备,微软希望它能改变“工作方式”。微软表示,它将比最初的版本更具沉浸感和舒适感,并提供“开箱即用的行业领先价值”。
微软HoloLens 2搭载了高通骁龙850处理器,但它不支持4G LTE。微软决定使用一款没有蜂窝调制解调器的ARM64芯片组。最重要的是,它包含了全新的全息处理单元(HPU)和AI协处理器。

6、努比亚推全球首款可穿戴柔性屏腕机

2月26日消息,努比亚在巴塞罗那当地时间25日发布全球首款“腕机”努比亚α。该款穿戴手机搭载了维信诺4.01英寸高可靠性柔性AMOLED显示屏,拥有超大显示面积,最小弯曲半径为8毫米,能够满足不同用户的舒适性穿戴需求。该屏幕硬度达到了7H,耐划伤性能等同刚性AMOLED屏。硬件方面,努比亚α搭载骁龙2100处理器,配备1GB+8GB的存储组合;续航方面,努比亚α的待机时长最高可达一周。此外,努比亚α还引入了eSIM功能,同中国联通展开合作。
目前努比亚α共有三种规格可眩蓝牙版售价449欧元,黑色eSIM版售价549欧元,18K镀金eSIM版售价649欧元。

7、高通拟为智能手机打造AR/VR头盔

据外媒报道,2月26日,在巴塞罗那举行的世界移动大会上,高通详细介绍了全球首款扩展现实XR专用芯片,该芯片支持小米、vivo、一加、LG、黑鲨和华硕等公司的高端手机与AR/VR头盔连接使用。高通表示,XR扩展现实专用芯片提供由内向外的六自由度(6DoF)跟踪。它们通过USB Type-C连接到包含其旗舰芯片组Snapdragon 855的手机上。这些AR/VR头盔通常以较低的价格出售,并与手机捆绑在一起销售,而且很快就会带有一个特殊的兼容性标志图标,表明它们已经达到了某些基准性能和兼容性阈值。

四、其它

1、中国电信向潘石屹发国内首张5G电话卡

2月15日消息,据《每日经济新闻》报道,中国电信下发了首张5G网络下的SIM卡,也就是5G手机电话卡,SOHO中国董事长潘石屹率先尝鲜。从图片上来看,该电话卡,133开头,0001结尾。不过一位运营商人士向记者分析,这只是运营商象征性、形式性的向合作伙伴发放5G  SIM卡,现阶段还不能使用,并非真正意义上运营商开始5G放号。他还表示,工信部尚未发布5G牌照,按照规划,下半年才能开始在部分城市实现5G通信的预商用。

2、高通发布首款3D超声波指纹读取器

https://s2.jiguo.com/3cc43e81-84e9-4666-83ae-074947507636
2月19日消息,据外媒报道,高通公司周二宣布了其首款超声波指纹读取器,它可使用声音解锁手机。这项技术被称为3D超声波传感器,它可以将声波从皮肤上反射出来,高通声称这种方法安全而方便。该传感器适合安置在手机屏幕之下,使手机制造商能够使用这项技术创建屏下指纹读取器。

3、高通推第二代5G基带芯片骁龙X55

2月20日消息,高通日前推出第二代5G NR调制解调器——骁龙X55 5G调制解调器。骁龙X55是一款7纳米单芯片,支持2G到5G,还支持5G NR毫米波和6 GHz以下频谱频段。在5G模式下,其可实现最高达7Gbps的下载速度和最高达3Gbps的上传速度。骁龙X55还将配合高通新推出的QTM525 5G mmWave天线模块,该模块设计用于将5G天线打包成纤薄紧凑的智能手机。

4、地方遴选科创板企业 最高补贴2000万

2月24日,证监会发布的《关于在上海证券交易所设立科创板并试点注册制的实施意见》征求意见结束,据不完全统计,目前已有13个省市公开发布过相关信息,并积极进行科创板企业的摸排工作。值得注意的是,北京市、浙江省以及陕西省已经完成科创板企业名单的遴选工作。
同时,为鼓励本地企业赴科创板上市,6个省市出台多项补贴政策。上海市最高补贴达到2000万元,补贴最低的省市也有100-200万元的奖励。

第二部分、科技报告摘要

一、埃森哲发布《技术展望2019》

埃森哲最新发布的《埃森哲技术展望2019》报告指出,企业正跨入数字化时代的新阶段,成功将取决于其能否运用一系列新技术的能力,为客户、员工及业务合作伙伴带来专属现实和个性化的体验。该年度报告预测了未来三年内将给企业带来颠覆性影响的重要技术趋势。
本年度《技术展望》报告的主题为“新数字化时代”。报告指出,随着企业数字化转型全面、深入地发展,新一轮变革的转折点近在眼前。数字技术能够帮助企业愈加深入、细致地了解客户,为其开辟更多接触消费者的渠道,同时使其与新的潜在合作伙伴共同扩展生态系统。如今,数字技术已不再是差异化竞争优势,而是企业制胜未来的必备要素。
埃森哲调研了包括411位中国企业领袖在内的全球6,600余位业务和信息技术高层管理者。近五分之四(79%)的受访者认为,企业已经不再孤立地应用数字技术 (特别是社交、移动、数据分析和云技术),而是将其视作企业核心技术基础的重要组成部分。
埃森哲首席技术与创新官保罗·多尔蒂(Paul Daugherty)表示:“随着新数字化时代的到来,企业需要思考一个新的问题:当所有企业都将开展数字化作为必要条件时,如何进行前瞻性布局才能独树一帜?显然,单纯应用数字技术已远远不够。企业必须不断发掘新的技术力量来创新业务模式,为客户提供个性化体验。同时,企业领导者还需践行信任与责任等价值观,这将是企业成功的关键。”
《埃森哲技术展望2019》指出,企业若想在快速发展变化的市场格局中脱颖而出,把握以下五大新兴技术趋势至关重要:
DARQ的力量:解码黑科技DNA。分布式账本技术(distributed ledgers)、人工智能(artificial intelligence)、泛现实(extended reality)和量子计算(quantum computing) — 简称DARQ,是引领下一阶段变革、重塑各个行业的新兴技术。埃森哲的调研显示,42%的中国企业受访者表示,未来三年内,人工智能对其企业的影响最大,远超其他几项DARQ技术。
懂我经济:了解每位消费者,发掘独特商机。 由技术驱动的客户互动,使得每位消费者都拥有了不断延展的的技术身份。这对于企业了解下一代消费者,并为其创造个性化、体验式的客户关系至关重要。超过五分之四的中国受访高管(84%)表示,数字人口特征有助企业把握全新的市场机遇,满足消费者需求。
超级员工:改变工作方式,激发员工创造力。 在新数字化时代,员工除了自身技能与知识储备之外,还在技术的帮助下培育出全新的能力。如今,公司必须支持全新的工作方式。超过三分之二(67%)的中国受访高管承认,员工的数字化成熟度要高于企业自身,企业亟需迎头赶上。
生态安全共同体:共筑安全屏障。互联互通是商业生态系统赖以维系的基础,但这也会增加企业面临的风险。企业领导者已经认识到,在与整个生态系统合作打造一流的产品、服务和体验的同时,还须竭力确保企业安全。 然而,仅有11%的中国受访高管表示,其生态系统合作伙伴正努力提升其合规性和抗风险能力。
专属市场:有应必答的极速柔性生产。飞速发展的数字技术正在打造一个高度个性化和即时体验的世界。为了满足消费者渴望的专属市场,企业必须重塑自身架构,将这些需求传递到生产端,实现精准的供需匹配。有85%的受访中国企业高管认为,整合定制化和实时交付的能力是建立下一轮竞争优势的关键。
埃森哲大中华区企业技术创新事业部总裁贾缙表示:“当数字化转型中的企业还在努力打造如创新服务、更高效率或者更个性化等竞争优势时,早一步跨入新数字化时代的领先企业已通过聚合各种力量改变市场本身的运作方式,从单一市场拓展到多个定制市场,按需定制,实时满足需求。”
报告指出,在新数字化时代,企业创新应着眼于构建人们周遭的环境,并在恰当的时机为客户提供产品和服务。领先企业已迈出第一步,随时准备为个体消费者量身定制产品、服务乃至生活场景,满足其从生活到工作的各方面需求,只为打造消费者所需的专属现实。
例如,日本电子商务平台Zozotown将个性化和定制化提升到了新的高度。其紧身连体衣Zozosuits与手机应用程序相联,可3D建模并精确测量顾客的身体尺寸。 Zozotown自有的服装生产线会根据消费者身体尺寸定制服饰,并在短短10天内送到客户手中。国泰航空旗下奖励计划“亚洲万里通”应用区块链技术,确保交易记录安全透明,让“亚洲万里通”、其合作伙伴及会员可以接近实时的方式管理交易记录,让会员所赚取里数可于翌日存入账户内。中国平安陆金所推出了采用AI算法模型的智能化理财产品,基于用户的真实投资与决策行为,了解用户的风险承受能力与偏好态度,为其提供符合其行为偏好和真实需求的个性化理财方案推荐。

二、阿里云研究中心《2019数字化趋势报告》

2月20日,阿里云研究中心发布《2019数字化趋势报告》。报告指出,当前数字化的应用领域正从互联网行业向政府、金融、零售、农业、工业、交通、物流、医疗健康等行业深入。其中, 政府、零售业等将成为受云计算、人工智能、IoT等新技术影响最深的行业领域,在未来3-5年内,数字化程度有望达到70%-80%。
以下为报告全文:
办证、审批一次都不用跑
区块链技术将应用于政务信用担保体系,电子身份证、电子签章等逐渐普及。节假日无法办理成为过去,在机器人与AI技术助力下,7×24小时在线办公成为可能, 市民通过网站、政务APP或支付宝等软件,足不出户即可完成办理。工商、社保、交管、出入境等行政类审批事务可实现秒批,个别需要周期申报或年审的项目可以像设置银行还款一样自动完成。
数字工厂大面积兴起
新零售将延伸到全产业链内部,AI、IoT、云计算、区块链等技术将真实收集用户需求,科学预测产量与销量,再将数据反馈给生产、物流、仓储等全产业链,彻底改变先生产再销售、先种植再贩卖的工业和农业模式,未来商品在生产之前就知道它的顾客是谁,个性化定制时代将真正到来,数字工厂大面积兴起。
线上线下无差别体验
线上线下服务和体验将打破对立关系,同频共赢。数据智能将把消费者带到线下,让线下商家也能做到想用户所想、所未想,实现千人千面,提供一致的高效服务和体验。而消费者打开手机就能发现附近有什么店铺、有什么品牌、有多少人买过、有哪些潮流新款、有哪些促销活动等,实现线上线下全触达,出门购物和线上购物将一样方便。
政企IT架构中台化
因数据割裂、智能决策程度有限的瓶颈制约,越来越多企业将全面升级IT架构,采用“双中台”模式。打破不同业务部门之间的烟囱式IT架构,实现“一切业务数据化”的目标,前端业务部门可以像搭积木一样调用平台上的产品技术模块,从而快速搭建新业务场景。除企业外,政府部门的IT架构也将中台化。
地产商从卖楼变为卖服务
房屋正从居住价值向生活价值转变,地产商逐渐从空间提供商向生活服务运营商转变。白天上班,家中老人和小孩的情况可以通过智能设备实时掌握,紧急状况下可实现医疗急救服务自动呼叫。私人医生、私人厨师等将成为智能社区标配。未来人们拥有的将不仅仅是房子,而是一种更高品质的生活服务。
居住的小区会认识你是谁
用声音就可以控制电视、灯光、空调等。伴随使用时间的增长,房屋还能智能学习主人的生活习惯,变得“能听会看”,认识、陪伴、照顾主人。社区将被打造成一个认识你的朋友,刷脸通行、刷脸取快递、刷脸购物等逐渐普及。同时,物联网系统将监控环境是否适宜,并主动控制能耗、 降低污染。
你知道餐桌上的肉来自哪里
农产品的种植、加工、运输、卖场四大环节全面升级,可实现全链路数据监测,确保品质最优、运输最快、消耗最小。在区块链技术的支持下,农产品可实现质量安全追溯。未来,消费者可以知道餐桌上的肉出自哪里、是否绿色健康。考虑到“物联网+区块链”仍有一定技术及成本门槛,这一改变有望在一些大型农企率先实现。
农民手上的烂苹果少了
信息不对称是农产品滞销的重要原因。随着人工智能、大数据等技术发展,现在部分地区已经开始由政府牵头,建立起完整的生产、流通、销售大图,不仅能及时了解市场的需求动态,还能反推生产,通过水肥灌溉、疾病预警等人工智能决策手段,种植出最受欢迎的农产品,
进一步解决农产品的滞销问题。同时,新技术也将成为扶贫抓手。
全国买车统一零售价
数字化将是汽车产业未来几年发展的关键。越来越多的汽车厂商、经销商会通过数字化门店提高经营效率,打通线上、线下数据为消费者提供丰富而高效的交易选择,最终形成一张高效的整车新零售网络。届时,价格更加透明化、服务更加标准化,在线购车体验将会进一步覆盖行业。未来,购车有望告别地域差价,全国买车线上、线下统一零售价。

三、联合国知识产权组织发布的《技术趋势2019:人工智能》

本报告共有153页,内容含金量满满,我们分别从数据和地域着手提炼出20个亮点,概览全球尤其是中国的AI专利及收购全貌。
数据篇
1、截止至2016年底,全球AI相关发明专利申请达近34万份,其中超过半数为2013年以后公布。
2、自2013年以来的AI专利申请数量,与自1950年代AI问世后的半个世纪申请数量相当。
3、机器学习是专利最多的AI技术,约占所有AI专利的1/3,2016年数量约为2013年的2倍。
4、全球前30专利申请方中,有26家是企业,4家是高校或科研机构。
5、IBM和微软拥有最多的AI专利申请,分别是8290项和 5930 项。
6、从1998年起,434家AI相关公司被收购,其中53%的收购发生自2016年至今。
7、AI领域有283家被收购公司来自美国,25家被收购公司来自英国。
8、前10大公司共做了79项收购,每家至少收购了5家AI公司。
9、基于公开信息,截至2018年5月,有2868家AI公司获得融资,总金额约为460亿美元。
10、在诉讼案例中共有1264项同族专利被提及,在异议案例中共有4231项同族专利被提及。
地域篇
1、中国拥有全球最具规模的专利局和最多的国内专利申请数量。
2、中国在全球科研机构的深度学习专利申请上领先,中国科学院、西电大、浙大拿下前三甲。
3、专利申请前20名的学术机构中有17家在中国。
4、中国和美国在AI应用和基础研究上的专利申请处于领导地位。
5、美国、中国、日本是最受欢迎的专利申请地,占专利申请总量的78%。
6、2014年,在中国首先注册的AI专利申请数量超越美国。
7、在中国首先注册的AI专利中仅有4%后续在其他地区注册。
8、最早的一笔AI相关专利由日本专利部门在 1980 年注册。
9、全球专利申请TOP20中有12家日本企业。
10、印度成为新兴的AI专利申请地。
以下为智能内参整理呈现的干货:

1、企业为AI专利申请主力军,美中两国优势明显

报告显示,自20世纪50年代AI问世以来,全球共提交近34万份AI相关发明专利申请,发表的科学出版物超过160万部,其中有超过半数的专利是在2013年至2016年间公布的。
根据报告提供的数据,美国、中国、日本为AI专利的主要申请国,在全球前30名专利申请方中,有26家是企业,仅有4家为高校或科研机构。
中国虽然起步偏晚,但在AI专利申请上具备极强的快速成长能力,从2006年起年均增长率达29%。到2014年,在中国首先注册的AI专利申请数量首次超过美国。
另外,专利共同所有权非常少见,前20名专利申请方中,无一家实体拥有超过百分之一的 AI 共同专利,与其他技术领域相似。
报告还指出,美国、中国和日本是专利申请最多的地点,共占专利申请总数的78%。在所有AI专利申请中,有1/3的申请方会在初次提交申请后再到其他国家办事处提交。
不过,与其他国家不同的是,中国公司和大学大都只在中国申请专利,且在中国提交申请后又在海外提交申请的企业或科研机构仅占4%。

1)IBM称霸AI专利榜,中国国家电网跃居前20

在AI相关专利排名前20名的公司中,有12家日本公司、3家美国公司、2家中国公司。这些日本企业并未大张旗鼓地宣传其AI技术,但正在悄然提升其竞争力。
美国国际商业机器公司(IBM)以8290项发明专利的申请数量独占鳌头,微软则以5930项发明位居第二,日本东芝公司(5223项)、韩国三星集团(5102项)和日本NEC集团(4406项)分列3、4、5名。
基于在生物启发方法和支持向量机等机器学习技术方面的研究,中国国家电网(SGCC)以70%的年均增长率跃居前20强,成为第15名。百度也跻身全球前30强,位列第26名。
报告还分析到,在某些技术和领域中,最多的专利申请源自该领域高度专业化的企业,如百度在深度学习专利众多,腾讯在社交网络表现突出。

2)中国科研机构成绩斐然,中科院专利数量领先

尽管企业在AI专利申请方面占据主导地位,但高校和科研机构作为先进技术的主要输出方,对分布式AI、神经机器人等特定领域的AI研究做出了重大贡献。
报告显示,前20家AI专利申请最多的科研机构中,有17家在中国,其余3所在韩国,美国和欧洲均未有机构在列;前20家AI相关科学出版物最多的科研机构,有10家在中国;入榜全球前30名AI专利申请方的4家科研机构中,有3家来自中国,分别是中科大(第17名)、西电大(第29名)和浙江大学(第30名)。
中国科学院有超过2500个同族专利和超过2万篇AI相关的科研论文,在公共科研机构的专利申请数量遥遥领先。此外,中科院的专利申请在2013-2016年间年均增长20%以上,等同于或超过大多数其他国家的组织的增长率。
在跻身全球前500强专利申请方的167所高校和科研机构中,有110家来自中国,20家来自美国,19 家来自韩国,4家来自日本。

2、机器学习高比例领衔,计算机视觉最受欢迎

WIPO报告提供了清晰的分析框架,将AI技术分为三类:AI技术,即高级统计和数学模型,如机器学习、专家系统;AI功能性应用,即可用一种或多种AI技术实现的功能,如语音处理和计算机视觉;AI应用领域,如通信、农业和交通。
报告显示,2013年至2016年期间,AI相关专利的年均增长率远高于所有技术领域,后者年均增长率为10%。
根据报告,中国和美国在 AI 技术和功能应用的专利申请上处于领先地位,日本在模糊逻辑、计算机视觉和语音处理领域、韩国在本体工程领域均优势明显。

1)AI技术趋势:机器学习占主导地位

从专利申请数量来看,机器学习技术在AI技术专利中占据主导地位,以超过13万的数量占据所有AI专利的1/3以上,年增长率为28%,2016年专利申请数量超过2013年的2倍。
其中,增速最快的当属深度学习,其在2016年专利数量达到2399项,年增长率达175%,远高于同期其他专利平均33%的年增长率。神经网络的同期增长率为46%,其专利数量在2016年达到6506项。

2)AI功能性应用:计算机视觉最为流行

最受欢迎的AI功能性应用是计算机视觉,49%的AI相关专利中有提及了这一技术,其年均增长率为 24%。其中,生物识别技术和场景理解的年增长率分别为31%和28%。
另外两个数量居多的AI功能性应用是自然语言处理(占所有AI相关专利的14%)和语音处理(13%)。同时,其他应用正在迅速发展和增长,比如机器人和控制方法的专利数量年增长率达到55%。

3)AI应用领域:交通运输类涨势最猛

报告显示,AI应用领域的分布情况为运输(占所有AI相关专利的15%),电信(15%),以及生命和医学科学(12%)。
其中,交通运输领域的发展最为蓬勃,年增长率达为33%。在交通运输类别中,航空航天/航空电子(年增长率67%)和自动驾驶(年增长率42%)以最为迅猛的涨势崛起。

3、被收购的AI公司多来自英美,微软苹果成法律纠纷常客

据现有收购数据,自1998年以来,共有434家AI公司被收购,有53%的收购自2016年起发生。其中绝大多数被收购的公司都是美国公司(283家),而英国以25家AI公司被收购排名第二。
从2012年以来,AI行业的收购数量逐年增加,在2017年达到103起。虽然谷歌母公司Alphabet在提交的发明数量中排名第十,共有3814项,但在收购AI公司方面位列第一。苹果和微软也积极参与收购,IBM、英特尔等公司则更倾向于收购成熟的公司。
报告指出,大部分被收购的公司都是初创企业,只有少量或者没有专利项目。这说明收购看中了被收购公司的其它资产,包括人才、数据、知识和其它知识产权。
此外,前20强专利申请方中没有一家与其他申请方共享超过1%的AI专利所有权。在围绕AI专利的法律纠纷中,WIPO发现了1264起AI同族专利,其中74%的案件发生在美国,全球有 4231 件专利异议案件。

4、20余位大牛分享观点,AI数据和人才是各国刚需

WIPO秘书长Francis Gurry表示,AI将在未来几年内成为军事和经济的重要组成部分,各大国将开始关注自身在AI领域的战略地位。面临这一情况,在WIPO组织领导下,成员国间就AI技术所带来的IP相关法律和道德问题开展对话讨论,显得至关重要。
他认为,美中两国庞大的人口基数为谷歌、百度等科技公司提供大量用户数据,同时国家对科技产业的支持亦是科技公司快速抢滩AI领域的重要因素。与此同时,欧洲各国在文化和语言方面的差异不利于大数据集合的形成,在某种程度上成为AI技术发展的障碍。
他也指出,世界上并没有任何可靠的方法来衡量专利申请的质量,“否则人们就不需要风险投资行业了。”
报告提供的不止有数据分析,还穿插着来自20余位全球顶尖AI专家们的前瞻性见解,包括我们熟知的吴恩达、李开复、王海峰等业界大牛。
比如,知名AI科学家、Landing AI董事长兼CEO吴恩达(Andrew Ng)提出促进AI落地的三个行动:加强产学政界合作、持续推动自由开放共享的AI知识和资源、拓宽人们学习AI的渠道。
他指出,基于中美强有力的政府支持,其他国家很难在AI的商业、工程和投资领域与美中两国竞争。另外,他认为AI尚未得到开发的最大机遇并不在软件行业,而是在农业、医疗保健和制造业等领域中。
创新工场CEO李开复预测未来五年,互联网、金融和电子商务将成为受AI影响最大的行业。
百度高级副总裁王海峰则认为,工业界存在将硬件和软件相结合使得AI技术更实用的趋势,深度学习框架和芯片可能另一个主宰未来AI行业的机会。
在人才方面,瑞士洛桑联邦理工学院(EPFL)智能系统实验室负责人Dario Floreano提出,机器人和AI专业亟需学生及研究者,并将确保未来的持续创新。
欧盟委员会首席顾问、司法部基本权利与公民联盟主管Paul Nemitz也表达了欧盟对AI的重视,称欧盟2021-2027年财务框架将加强包括AI在内的高级数字技能培训计划,以吸引和留住更多欧洲AI人才。
从全球范围来看,中国虽在IP领域起步稍晚,但经过快速成长,如今已经拥有全球最大的专利局和最多的国内专利申请数量,中国的AI专利和科学出版物数量均名列前茅,呈现高速成长趋势,尤其是高校与研究机构的专利布局,在整个世界舞台上遥遥领先。但与此同时,我国企业的AI专利申请数量和美国相比明显落了下风,在国内申请专利后,中国企业也应多在海外国家进行专利申请,并更多推动产学政界的合作,建立更加稳健良性发展的AI生态。

四、清华大学发布《人工智能之数据挖掘》

1、数据挖掘与KDD

数据挖掘(Data Mining),是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的数据和信息,并将其转化为计算机可处理的结构化表示。
目前数据挖掘的主要功能包括概念描述、关联分析、分类、聚类和偏差检测等,用于描述对象内涵、概括对象特征、发现数据规律、检测异常数据等。
一般来说,数据挖掘过程有五个步骤:确定挖掘目的、数据准备、进行数据挖掘、结果分析、知识的同化

1)确定挖掘目的

认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结果是不可预测的,但要探索的问题应是有预见的。

2)数据准备

数据准备又分为三个阶段:
1)数据的选择:搜索所有与目标对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据;
2)数据的预处理:研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型;
3)数据的转换:将数据转换成一个分析模型。这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。

3)进行数据挖掘

对得到的经过转换的数据进行挖掘。

4)结果分析

解释并评估结果,其使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术。

5)知识的同化

将分析所得到的知识集成到所要应用的地方去。
数据挖掘有多种分类方式,可以按照挖掘的数据库类型、挖掘的知识类型、挖掘所用的技术类型进行分类。
同时,数据挖掘也可以按照行业应用来进行分类,比如生物医学、交通、金融等行业都有其独特的数据挖掘方法,不能做到用同一个数据挖掘技术应用到各个行业领域。
数据挖掘是知识发现(KDD)的一个关键步骤。1989年8月,Gregory I. Piatetsky- Shapiro等人在美国底特律的国际人工智能联合会议(IJCAI)上召开了一个专题讨论会(workshop),首次提出了知识发现(Knowledge Discovery in Database,KDD)这一概念。
KDD涉及数据库、机器学习、统计学、模式识别、数据可视化、高性能计算、知识获取、神经网络、信息检索等众多学科和技术的集成,再后来的30年间KDD逐渐形成了一个独立、蓬勃发展的交叉研究领域。
早期比较有影响力的发现算法有:IBM的Rakesh Agrawal的关联算法、UIUC大学韩家炜(Jiawei Han)教授等人的FP Tree算法、澳大利亚的John Ross Quinlan教授的分类算法、密西根州立大学Erick Goodman的遗传算法等等。
目前,数据挖掘已经引起国际、国内工业界的广泛关注,IBM、谷歌、亚马逊、微软、Facebook、阿里巴巴、腾讯、百度等都在数据挖掘研究方面进行了应用与理论研究。
国际知识发现与数据挖掘大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,简称SIGKDD)是数据挖掘领域的顶级国际会议,由ACM的数据挖掘及知识发现专委会负责协调筹办,会议内容涵盖数据挖掘的基础理论、算法和实际应用。

2、数据挖掘源于商业的直接需求

数据挖掘技术从一开始就是面向应用的,源于商业的直接需求。目前数据挖掘在零售、旅游、物流、医学等领域都有所应用,可以大大提高行业效率和行业质量。
举个例子,零售领域是数据挖掘的主要应用领域之一。这是因为由于条形码技术的发展使得前端收款机系统可以收集大量售货、顾客购买历史记录、货物进出状况、消费与服务记录等数据。
数据挖掘技术有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更高的顾客保持力和满意程度,减少零售业成本。
同时,同一顾客在不同时期购买的商品数据可以分组为序列,序列模式挖掘可用于分析顾客的消费或忠诚度的变化,据此对价格和商品的花样加以调整和更新,以便留住老客户,吸引新客户。
与此同时,社交网络也是数据挖掘研究中的热门领域,比如新浪微博就是拥有海量数据的资讯平台。
截止到2017年12月,新郎微博已拥有接近4亿活跃用户,内容存量超千亿,“大V”的一举一动和社会热点话题都会引起大量的评论与转发,掀起一股“数据风暴”。
微博上每个用户的言论、转发内容等都蕴藏着用户个人的兴趣、话题等信息,文字内容本身的智能分析理解也是数据分析领域长久以来孜孜不倦追求的目标。
社会网络中的聚类被称为社区发现,许多精心设计的高效算法可以很好地处理上亿用户的大规模网络。
针对微博用户的海量数据,对其进行数据描述性可以分析群体的年龄、性别比例、职业等;对于平均数、中位数、分位数、方差等统计指标可以帮助我们粗略了解数据分布;回归分析、方差分析等方法则可以解释年龄、职业等因素是否会影响用户对某热门话题的关注程度。
此外,数据挖掘在旅游、物流、医学等领域都有着广泛的应用场景。比如数据挖掘可以对旅游客流的趋向有着准确的预知性,同时对于游客的喜好也有着直接性的掌握;从医学数据中寻找潜在的关系或规律,可以获得对病人进行诊断、治疗的有效知识,增加对疾病预测的准确性等。

3、人工智能与数据挖掘

数据挖掘从一个新的视角将数据库技术、统计学、机器学习、信息检索技术、数据可视化和模式识别与人工智能等领域有机结合起来,它组合了各个领域的优点,因而能从数据中挖掘到运用其他传统方法不能发现的有用知识。
一般来说,统计特征只能反映数据的极少量信息。简单的统计分析可以帮助我们了解数据,如果希望对大数据进行逐个地、更深层次地探索,总结出规律和模型,则需要更加智能的基于机器学习的数据分析方法。
所谓“机器学习”,是基于数据本身的,自动构建解决问题的规则与方法。数据挖掘中既可以用到非监督学习方法,也可以用到监督学习方法。

1)非监督学习

非监督学习是建立在所有数据的标签,即所属的类别都是未知的情况下使用的分类方法。对于特定的一组数据,不知道这些数据应该分为哪几类,也不知道这些类别本来应该有怎样的特征,只知道每个数据的特征向量。若按它们的相关程度分成很多类,最先想到的想法就是认为特征空间中距离较近的向量之间也较为相关,倘若一个元素只和其中某些元素比较接近,和另一些元素则相距较远。
这时候,我们就希望每一个类有一个“中心”,“中心”也是特征向量空间中的向量,是所有那一类的元素在向量空间上的重心,即他的每一维为所有包含在这一类中的元素的那一维的平均值。如果每一类都有这么一个“中心”,那么我们在分类数据时,只需要看他离哪个“中心”的距离最近,就将他分到该类即可,这也就是K-means算法的思路。
K-means算法,在1957年由Stuart Lloyd在贝尔实验室提出,最初用于解决连续的图区域划分问题,1982年正式发表。1965年,E.W.Forgy发明了Lloyd-Forgy or。James MacQueen在1967年将其命名为K-means算法。
以随机生成的数据点为例,k=3的K-means算法的迭代过程,其中五角星为聚类中心,点的颜色是其类别。在实际应用中,为了获得一个比较好的特征空间,使得“数据之间的相似性与他们在特征空间上的距离有关,距离越近越相似”这句话尽可能成立,我们往往会构建模型来把原数据变换到这么一个特征空间,然后使用K-means算法来进行分类。

2)监督学习

不同于非监督学习,若已知一些数据上的真实分类情况,现在要对新的未知的数据进行分类。这时候利用已知的分类信息,可以得到一些更精确的分类方法,这些就是监督学习方法。
1)决策树模型
所谓决策树,即是一种根据条件来进行判断的逻辑框架。其中,判断的条件,即提出有区分性的问题,以及对于不同的回答下一步的反映,以及最终的决策给出标签。
决策树算法:
1.选取包含所有数据的全集为算法的初始集合A0:
2.对于当前的集合A,计算所有可能的“问题”在训练集上的F(A,D):
3.选择F(A,D)最大的“问题”,对数据进行提问,将当前的集合由“问题”的不同回答,划分为数个子集;
4.对每个子集,重复b、c,直到所有子集内所有元素的类别相同;
5.在实际应用中,数据往往有很多特征,因此,“问题”往往是选取数据的某一特征,而“回答”则是此特征对应的值。
在决策树中,效度函数F(A,D)的选择非常重要。决策树的发展历史,也基本是围绕着F(A,D)的优化而展开。
2)kNN算法
只知道每个数据在特征空间下的特征向量情况下,可以对数据采用无监督分类方法K-means。如果我们拥有了其中一部分数据的标签,我们就可以利用这些标签进行kNN分类。
数据之间的相似性与他们在特征空间上的距离有关。距离越近越相似,越可能拥有相同的标签。
假设我们已经有了很多既知道特征向量也知道具体标签的数据对于新的只知道特征向量却不知道具体标签的数据,我们可以选取离这个特征向量最近的k个已经知道标签的数据,然后选取他们中间最多的元素所属于的那个标签,作为新数据的预测标签。也可以根据他们与新数据的特征向量之间的距离加权(如最近得5分,第二近得4分等),取权重总和最大的标签作为预测标签。
kNN算法不需要构建模型或者训练,和K-means算法一样,往往是和某个构建特征空间的模型一起使用。
此外,还有回归分类、神经网络、朴素贝叶斯分类等等。

4、巨头们的数据挖掘之路

在当下,数据挖掘也逐渐成为当下的热门研究领域之一,受到了谷歌、亚马逊、微软、百度、阿里、腾讯等科技巨头的追捧。

1)谷歌

谷歌几乎每年都会发表一些让人惊艳的研究工作,包括之前的MapReduce、Word2Vec、BigTable,近期的BERT。数据挖掘是谷歌研究的一个重点领域。
2018年谷歌全球不同研究中心在数据挖掘顶级国际会议KDD上一共发表了7篇文章。

2)亚马逊

亚马逊公司近几年发展势头超级猛,前几年华丽的转身:从一个网上商店公司变为云平台公司再转变到目前的人工智能公司,亚马逊也在数据挖掘领域开始占有一席,尤其是在人才网罗、开源、核心技术研发。
2018年亚马逊在数据挖掘顶级国际会议KDD的Applied Data Science Track(应用数据科学Track)上一共发表了2篇文章,另外还有两个应用科学的邀请报告。

3)微软

微软是老牌论文王国,一直以来都在学术界特别活跃,因此在KDD上每年和微软有关的论文非常多,因此这里只统计了微软作为第一作者的文章。
2018年在数据挖掘顶级国际会议KDD上一共发表了6篇文章,另外还有一个应用科学的邀请报告,这些文章和报告都更多的从大数据的角度在思考如何更有效,更快速的分析。

4)阿里巴巴

阿里巴巴在电子商务方面做了大量的数据挖掘研究。尤其是在表示学习和增强学习做了几个很有意思的工作。
2018年阿里巴巴在数据挖掘顶级国际会议KDD上作为第一作者单位一共发表了8篇文章。

5)腾讯

2018年腾讯在数据挖掘顶级国际会议KDD上作为第一作者单位一共发表了2篇文章。

6)百度

2018年百度在数据挖掘顶级国际会议KDD上作为第一作者单位一共发表了2篇文章。

5、大数据与数据挖掘

大数据是近年随着互联网、物联网、通信网络以及人类社交网络快速发展的结果,成为一个交叉研究学科,和数据挖掘紧密相连。
大数据的迅速发展也使得数据挖掘对象变得更为复杂,不仅包括人类社会与物理世界的复杂联系,还包括呈现出的高度动态化。这使得很多传统数据挖掘算法不再适用,传统数据挖掘算法必须满足对真实数据和实时数据的处理能力,才能从大量无序数据中获取真正价值。
一方面大数据包含数据挖掘的各个阶段,即数据收集、预处理、特征选择、模式挖掘、表示等;另一方面大数据的基础架构又为数据挖掘提供上层数据处理的硬件设施。
从技术架构角度,大数据处理平台可划分为4个层次:数据采集层、数据存储层、数据处理层和服务封装层。
除此之外,大数据处理平台一般还包括数据安全和隐式保护模块,这一模块贯穿大数据处理平台的各个层次。