邬贺铨/Wu Hequan

(中国互联网协会 北京100009)

(Internet Society of China,Beijing 100009,China)

1 泛在化的消费应用

1.1 中国互联网用户的应用类型与比例

中国互联网用户的应用类型有搜索引擎等各种各样的业务,近70%的互联网用户都会使用视频。中国互联网用户的应用类型与比例如图1所示。

1.2 中国移动互联网用户的应用

中国移动互联网用户的应用如图2所示。2014年上半年,使用移动视频用户的比例为55.7%,使用即时通信的用户比例为87%。

1.3 移动化成为趋势

(1)淘宝

阿里巴巴移动端月活跃用户1.63亿,移动交易额占总交易额的比例从2013年的10.7%上升到2014年的27.4%。来自无线业务的收入较2013年同期增691%,占比已经高达12%。2014年阿里巴巴“双十一”促销,移动端支付占50%,2013年仅15%。

(2)百度

从2014年10月起使用移动搜索流量超过了PC搜索。百度的移动营收占比从去年底的20%增长到2014年6月的30%。

(3)腾讯

2014年6月,QQ月活跃用户8.29亿,其中智能终端活跃账户达到5.21亿,同比增长45%。微信活跃用户4.38亿。

(4)京东

2014年“双十一”移动端销售比例达到40%。

IDC预测到2017年美国的移动电子商务将占电子商务收入的50%。

1.4 全媒体搜索

移动搜索具有四大趋势:第一为交互移动化;第二为场景移动化,提供与用户地理位置适合的搜索;第三为服务闭环化,通过轻应用连接线下;第四为知识图谱化,智慧精准提供服务。移动搜索能力演进如图3所示,移动搜索输入方式的使用比例如图4所示。可以看出,文字搜索比例变化不大,语音搜索和图像搜索比例已经增加了不少。移动搜索会给搜索本身带来一些新的特点,手机屏幕小,不可能显示普通PC上搜索的形式,所以有交互移动化、场景移动化、服务移动化,知识图谱化的特点。

图1 中国互联网用户的应用类型与比例

图2 移动互联网应用的用户数占移动用户比例尺(2010Q4~2014Q2)

截至2014年6月底,用户在百度搜索上的需求与去年同期相比增加了133%,使用手机搜索的用户占手机用户的77%,2014年11月移动搜索流量已超过PC上的搜索。

图3 移动搜索能力演进

图4 移动搜索输入方式的使用比例

1.5 移动支付

2011年中国移动电子商务市场交易规模为156.7亿元人民币,预计到2015年将达到1 046.7亿元人民币。根据艾瑞咨询发布的数据,2014年第二季度,我国第三方移动支付市场交易规模达13 834.6亿元人民币。

艾瑞咨询最新数据显示,2013年中国移动支付的每月使用数,28.3%的网民为1~2次,24.5%为3~5次,23.4%为10次以上。在18岁以下的网民中,每月使用10次以上移动支付的用户比例达40.91%。

2014年阿里巴巴“双十一”促销中,移动端支付占50%,2013年这一比例是15%;京东“双十一”移动端销售比例达到40%。

2014年12月12日,支付宝大幅补贴线下支付,本次线下营销被看作阿里推广移动支付的重要手段。

苹果公司推出的Apple Pay更是加速在线交易资金从PC端向移动端的转移。

1.6 互联网在商业的应用

沃尔玛基于每月4 500万网购数据并结合网上挖掘出对产品的大众评分,开发语义搜索引擎,方便浏览,在线购物者增加10%~15%,增加销售十多亿美元。另外,通过对消费者购物行为分析,了解顾客购物习惯,优化商品陈列。

2013年美国互联网广告首次超过传统媒体,高达428亿美元。

2014年第二季度中国网络广告市场规模达到了381.5亿元人民币,同比增长48.7%,环比增长29.2%。

1.7 车联网

2014年4月,苹果和谷歌各自发布车联网底层系统。

2014年9月,腾讯联手四维图新发布首个车联网整体解决方案“WeDrive”,腾讯“路宝盒子”正式发布,提供智能导航、全车体检、故障解读和油耗提醒四大功能。

随着特斯拉等电动车逐渐成熟,汽车电子和车联网对于汽车的重要性再度提升。

1.8 大数据在影视业的应用

Netflix每天记录用户暂停、回放、快进、停止等动作和评分,据此预判观众喜好,选择导演和演员及调整剧情,吸引用户付费订阅,多屏收视使《纸牌屋》成功。

图5 OTT产业链的延伸

阿里巴巴推出“娱乐宝”,百度推出“众筹”频道,网民出资100元人民币即可投资影视作品,预期年化收益率7%。

众筹电影《爸爸去哪儿》拍摄4天半,获得7亿元人民币票房,《小时代》3个系列制作费用不过6 000万元人民币,票房已经超过10亿元人民币。

1.9 消费服务的OTT(Over the Top)化

互联网已进入OTT的领域,图5为OTT产业链的延伸。目前,典型的OTT业务有互联网电视业务、应用商店等。互联网电视发展很快,网络电视是指互联网内容服务商经营的,在互联网上将电视作为数据传送。IPTV是指电信部门运营的,在可管理的互联网上将电视作为电信业务。有线电视由广电部门运营,将电视作为视频广播。网络电视对于有线电视和IPTV就是OTT应用。另外,微信对于传统电信业务也是OTT,它颠覆了传统的电信运营模式,电信运营商和有线电视公司都面临着互联网的挑战。

1.10 消费服务的O2O(线上到线下)化

百度“直达号”是商家在百度移动平台的服务账号,基于移动搜索、@账号、地图、个性化推荐等多种方式,让客户直达商家服务,还为商家提供CRM后台。苏宁云商从名称到战略从线下到线上扩展转型,O2O同品同价,本地化营销,社交化传播,开放平台,夯实物流。表1为部分企业推出的O2O服务。

1.11 互联网金融的新动态

互联网金融最重要的特征是通过互联网、移动互联网等工具,使得传统金融业务具备透明度更强、参与度更高、协作性更好、中间成本更低、操作上更便捷的特点。

2014年9月苹果公司推出的Apple Pay更是强化了用户远程支付习惯,加速在线交易资金从PC端向移动端转移,加固苹果生态圈,并有可能渗透到金融信贷业务。

2014年12月11日,全球最大的P2P网贷平台Lending Club在纽约交易所正式挂牌。上市首日股价报收较发行价高出56.2%,Lending Club的市值约为85亿美元。这一消息极大利好了中国互联网金融行业尤其是P2P平台。

1.12 中国互联网金融的新局面

2013年中国共处理互联网支付业务的金额达到8.96万亿元人民币,同比增长近30%。P2P市场的交易金额猛增至1 100亿元人民币,较2012年相比增长了10倍。2014年P2P网贷市场交易额为2 500亿元人民币左右。

阿里公司基于支付宝的3亿实名用户、在线钱包1.9亿活跃用户、日常交易4 500万笔的大数据,建设投融资平台。阿里公司2014年10月推出“蚂蚁金服”,有可能扩展成为互联网金融业的纽交所。

搜狐、新浪等机构2014年也通过旗下平台“搜易贷”、“微财富”进军互联网金融。

京东金融与远洋地产合作,进行众筹模式应用于地产行业的O2O尝试。

淘宝的“招财宝”、苏宁的“零钱宝”、平安银行的“小票通”,民生银行的“电商E票通”进入票据理财业务,基于银行承兑汇票的信用,收益比“宝宝”类产品更胜一筹。

2015年监管部门将按照“适度监管、分类监管、协同监管、创新监管”的原则,鼓励创新、促进健康发展,建立和完善互联网金融监管框架。

2 数据化的市政管理

2.1 从大数据分析城市消费状况

淘宝网建立淘宝指数,通过采集、编制淘宝网上成交额比重达到57.4%的390个类目的热门商品的价格走势,反映网络购物市场整体状况以及城市主流人群的消费状况。

表1 部分企业的O2O服务

目前每天在百度上搜索汽车的次数高达一千万次,百度将网民对汽车的各类搜索请求进行大数据挖掘,可帮助车企深入了解消费者需求,设计新品及资源调配,也可提供对城市汽车需求的把握。

百度金融理财类搜索引擎在2013年的日搜索量高达3.3亿次,基于理财的搜索需求,从中也可了解城市人群对经济状况的预期。

2.2 城市电力数据的应用

IBM通过对历史数据分析做风场200 m×200 m的小尺度(通常气象局是100 km×100 km尺度)72 h风力预报,预测未来发电量,使电网能提前均衡,并网出力增加10%。

美国加州大学洛杉矶分校将人口调查信息、用户实时用电信息和地理、气象等信息全部整合,设计了“电力地图”,能更准确地反应该区经济状况及各群体的行为习惯,为城市和电网规划提供基础依据。

国家电网公司年均产生数据510 TB(不含视频),2012年已累计产生数据5 PB。

利用城市用电负荷的变化可以判断城市经济特别是工业的增减状况。

2.3 大数据与交通运输

拥堵指数表示拥堵比非拥堵所需出行时间的倍数。北京高峰时段拥堵指数2.12(早高峰2.01,晚高峰2.25,平时1.74)、平均速度22 km/h,每10 km需时27.3 min、每10 km延时14.4 min。APEC会议期间因实施单双号管理,北京高峰时段拥堵指数下降36%,平均车速升至36 km/h,车速提升了60%。

高德公司以众包思路采集3亿多高德地图用户的出行数据,并融合几十万辆出租车及几百万辆物流车的浮动车数据,得出全国城市拥堵排名,见表2所列。

高德副总裁董振宁于2014年8月28日在2014中国移动互联网年会上的报告中指出,据高德地图抽样统计估算,使用高德地图躲避拥堵功能智能出行,可节省15%~20%的时间成本,平均每月为用户节省的时长总计可达700年,节省的油耗高达1 840万升,折合人民币1亿3千万元。

2.4 开放数据促进公用事业效率提升

美国交通部开放了全美航班飞行的数据,有市民利用这些数据开发了航班延误时间的分析系统,帮助旅客选择正点率高的航班,推动航空公司提升正点率,美国航班延误率从2008年的27%下降到2010年的20.23%。

纽约市的Sense Networks公司利用个人位置数据推出了可实时给出城市人群活动集中地点的CitySense服务,还给出每周每小时出租车上客最多的街角排行榜的集合图CabSense服务。

北京公交一卡通每天使用4千万人次,地铁一千万人次,北京市交通调度中心每天数据增量30GB,存储量20 TB。这些数据如果公开可了解北京大众每日出行的规律,依此可优化北京的公交规划。

2.5 数据与环境

环境保护问题是目前各国所关注的重点问题之一,通过对环保数据的收集,利用大数据技术可以对目前环境状况进行分析,采取有效措施保护和治理。如美国对湖泊水底取样,升到水面再取样,通过无线发送出去,利用后台的云计算、数据中心,数据挖掘技术,将来在网上可以呈现一条数字化的河流的模型,点击河流的任何一点都可以知道这里面的污染状况。通过卫星观察对流层二氧化氮情况,以及每年每月测试的PM2.5的数据,可进行大气的治理。图6为2013年测试出京津冀13个城市的PM2.5平均浓度。

2.6 大数据在流行病预测中应用

Google把5 000万条美国人搜索词和美国疾控中心在2003~2008年间流感传播期的数据进行了比较,建立数学模型,结合45条检索词条,在2009年甲型H1N1流感爆发的几周前,Google就给出了预测,与疾控中心数据相关性高达97%。

中科院与百度合作,精选了160多条关键词,对5年来的数据进行建模分析,先于卫生部门公布前几周得出中国艾滋感染人群的分布情况,估值基本一致。

2.7 优化城市医疗资源

表2 全国城市拥堵排名

北京每百万人口的三级医院数和每千人的床位数分别为全国平均水平的2.7倍和2.2倍。按照北京的人口计算,北京还缺40~60个综合医院。北京的医院2013年诊疗2亿人次,其中外来就诊和住院人数分别占三级医院的36%和41%,外来就医与陪护人员日均70万人。因此,需要开放北京医疗能力数据,优化北京的医疗资源,同时增强社区医院的能力,推广居家健康监视,缓解北京看病难的问题。

图6 2013年京津冀13个城市的PM2.5的平均浓度

2.8 大数据在热点检测中应用

利用短信、微博、微信和搜索引擎可以收集热点事件与舆情挖掘。通过对微博用户建立档案,提前关注可能引起社会不稳定的因素。

在长假之前,很多人会在网络上搜索旅游点、旅店、火车与飞机航班信息或自驾游的路线等,由此可预知哪些旅游点和交通线路会拥塞。

2.9 政府开放数据助力城市治安管理

纽约市详尽犯罪记录数据开放后,出现了提示公众避免进入犯罪高发区域和提高警惕的手机应用,而且还能将犯罪记录信息和动态交通数据结合起来,起到指导调配警力的作用。

2012年美国加州大学分析洛杉矶市政府提供的过去1 300多万起案件数据,找到了各小区发案与日期、天气、交通状况及其他相关事件的关系,建立犯罪活动预测平台,该系统已使该地区财产犯罪率和盗窃案件分别下降12%和26%。

美国把20多年的犯罪数据和交通事故数据映射到同一张地图上后惊奇地发现,交通事故和犯罪活动在时空上都有高度的重合性,美国公路安全部门与司法部门通过共治,交通事故率和犯罪率双双下降。

2.10 城市政法系统的数据

浙江法院系统建成了动态更新、开放共享的全省法院数据中心和覆盖全省1 758个审判用法庭的数字法庭统一管理平台,汇总全省758万余件案件数据和84万余件案件庭审录音录像,先后开发了100多个应用系统。

浙江法院建成了覆盖在浙52家商业银行的网上专线查询被执行人存款的系统。自去年6月该系统开通以来,已查询被执行人存款118万人次,查到存款余额1 745亿元人民币,13.8万件案件得以执结。

北京的“检立方”系统以覆盖北京市三级检察院的50万件案件、380万份法律文书、9 800万项检察信息为基础,已经积累了50万件案件、过亿项信息的“大数据”,集中接入了控申接待、远程指挥、远程讯问、警车轨迹等音视频信号,整合部署了160多项应用,可以从中统计692项业务点,生成139项指标和报告。

深圳市公安局信综平台拥有人员档案1.16亿份,电话号码档案1.39亿份,场所档案1 200多万份,车辆档案900多万份。

2.11 舆情分析与政治

奥巴马竞选团队有数千名志愿者,通过社交网络和微博等收集选民的爱好和关注,同时运行66 000个计算机分析数据并建立选民档案,如某个选民在Facebook或者Twitter上的大部分帖子都是关于环保和医疗成本,就通过电子邮件发一条源自奥巴马专门谈论环境问题的信息,让该选民有理由支持总统连任。与2008年的竞选相比,捐助者增加了50万人,数字筹款增加了20%,广告投放效率提升15%。

微软纽约研究院的经济学家David Rothschild根据网络舆情在2012年预测美国总统选举结果,对51个选区预测命中其中50个,准确率达98%。

2.12 数据开放激励创新

1983年,美国将原本用于军事的卫星定位系统GPS向公众开放使用,并且在2000年后取消了对美国民用GPS精度的限制,从汽车导航、精准农业耕作到物流、通讯等,GPS开放后不仅服务了生产和生活,同时还创造了大量就业岗位,据估算仅美国国内就有约300万的就业岗位依赖于GPS。

开放数据平台会吸引大量高科技人才和企业的关注,激发前沿的创新和应用。虽然Data.gov成立时间不长,但围绕着纽约开放数据平台而产生的应用开发团队已有几百个。

Data.Gov不仅是一个创新的结果,它的出现,代表着数据在社会的自由流动、知识向大众的自由流动,这为更多的大众创新、社会创新提供了一个平台。

2.13 众包助力电信大数据及应用

网络上有500万移动手机用户是电信运营商的志愿者,电信运营商给他们提供优惠资费的服务,通过预置在手机中的测试软件对网络性能的实时检测,可以优化网络的性能,改进用户的体验,判断交通的拥堵情况及城市人群密集的突发事件发生地点等。图7为电信运行商获取数据的原理。

(1)优化网络性能

以用户的体验视觉实时跟踪网络性能,准确掌握每个基站的动态流量和忙闲,为网络优化、扩容和改进提供依据。

(2)改进对客户的服务

获取移动用户上网记录,解决用户透明消费问题,使用其中的数据做精细化营销。有针对性地开发业务和优化资费模式。

(3)掌控实时交通流量

动态跟踪手机用户的位置和运动速度,提供精准的车流和行人实况,支撑交通规划和流量疏导。

图7 电信运行商获取数据的原理

高德地图采用了基于众包的实时交通应用模式,每天近千万使用高德地图在线导航的用户给高德实时交通贡献了大量的用户出行服务数据。高德地图用户既是实时交通信息的使用者和享受者,又是实时交通信息的贡献者。高德地图用户越多,贡献的数据就越多,高德的实时导航就越精细,实时交通服务质量就越好,就会有更多的用户使用,将形成良性循环。

(4)市政规划和管理

依据手机用户的地域分布,实时提供人口密集情况,有利于对突发事件的预警,长期的统计结果可用于城市规划。

2.14 政府开放数据扶持中小企业

美国Panjiva公司(磐聚网)利用政府开放的海关货运数据建立全球外贸搜索引擎,成为面向采购商和供应商的智能B2B平台,每年采集上亿条货运记录,包括发货人、收货人、集装箱内货物内容和价值等,同时提供信用报告、合格证、网站和供应商等信息。

美国农业部建立一个网站,链接348个农业数据集,通过数据挖掘找到最佳土壤、湿度、日照时间,准确判断农作物是否需要施肥、浇水或者打药,农民还可从数据中分析市场价格,避免因供需失衡给农民带来经济损失。

3 智能化的生产制造

3.1 加紧布局企业级应用

BAT互联网巨头加快布局企业级应用:阿里收购恒生电子布局金融信息,收购石基信息布局酒店、餐饮信息化;百度推出“直达号”服务,为商家提供精准营销、在线CRM管理服务等;腾讯除了早前已布局的企业邮箱、企业QQ外,还推出了“企业微信号”。

从2010年第四季度到2013年第二季度,中国专注于企业的开发者从29.3%增至42.7%;以个人消费者为重点的开发者比例从70.7%降至57.2%。

3.2 大数据在各产业领域中的应用

(1)发动机运行监视

●GE的每个引擎装20个传感器,在飞行过程中每隔一段时间通过卫星将传感器收集的引擎状态传给GE公司。每个引擎每飞行小时产生20 TB,从伦敦到纽约每一飞行产生640 TB级数据,GE每天收集PB级引擎数据。美国每月收集360万次飞行记录,监视机队25000个引擎。

●GE通过对所生产的2万台喷气引擎的数据分析,开发的算法能够提前一个月预测其维护需求,预测准确率达到70%。将发动机的处理过程从30天压缩为20 min。

●目前全球有24个航空公司的340万英里航线使用GE的发动机,可每年及时发现2000次可能的缺陷。

(2)燃油节约

●按照美国交通运输局报告,美国航空公司每年耗费大约480亿美元的燃油,如果降低燃油消耗2%,将节省10亿美元。这还未计算到全球航空业,如果将飞机上传感数据收集和分析用于燃油效率上,1%的提高就能使全球航空业每年省20亿美元。

●巴西航空公司Gol Linhas Aéreas Inteligentes采用了GE公司开发的绿色畅想大数据系统中的飞行效果服务,优化了航线,平均每航线节约了22英里和77加仑燃油,为公司节约1亿美元,每次飞行减排了1 628磅二氧化碳。

(3)航空业正点运行

●据美国交通统计局的报告,2013年美国航空公司的75万次航班晚点,25%的航班延迟15 min以上甚至取消。对航空公司和旅客都带来巨大经济损失。利用GE公司的大数据,对喷气引擎预防性维护,在美国就防止了不止6万次的航班延误或取消。

●GE航空部门与埃森哲合资建立Taleris公司,收集飞机上的传感器数据、空中流量数据、气候等数据,开发产业互联网软件系统,两年来已帮助国内航线避免1 000次延迟起飞与取消,帮助多于16.5万旅客准时到达目的地。

(4)油气管线

●全球油气管线已经超过2百万英里,足够环绕赤道80圈,GE公司估计每15万英里管线产生的数据将超过国会图书馆馆藏图书的数据量,即10 TB。

●美国管线运营商每年投入超过400亿美元来维护、更新和扩展他们的管网。目前许多美国管网已服役超过20年。

●智能管线解决方案相同设计用于从沿线安装的传感器上收集数据,将它与外部数据源同步,向客户传递详细分析的数据源及从网络关键点得到的风险估计。

(5)铁路运输

●GE公司的软件和交通运输工程师开发了Movement Planner软件,这是使用数据来改进机器与设施效率及改善环境的很好案例。

●Norfolk Southern是一个有2万英里长度铁路的美国公司,几年前使用了 Movement Planner软件,在燃料使用方面节约了6.3%,运行速度提升了10%~20%。

●如果使用产业互联网和大数据来有效管理机器,将劳动生产率加倍,从1%提升到2%,到2030年将节约全球汽油消耗的1/3。

(6)医疗设备

GE公司通过统计分析全球不同人群、不同部位、不同扫描方式的CT效果,给出建议剂量。在比利时的CT实验室发现可将全年的CT的扫描剂量降低41%,从而避免可能发生的致癌风险。

3.3 大数据推动生产个性化

红领服装公司积累了超过200万名顾客个性化定制的版型数据,包括款式(领型、袖型、扣型、口袋、衣片组合等)和工艺数据,建立个性化量身定制MTM(made-to-measure)服装数据系统。顾客只需按红领量体法采集身体18个部位的22个数据,输入该系统自动建模,形成专属于该顾客的版型,并将成衣数据分解到各工序,跟随电子标签流转到车间每个工位。

红领公司开创C2M(消费者到工厂)的直销方式,客户自主决定蓝图、工艺、价格、服务方式,可在7个工作日交付成品西服。用工业化的流程生产个性化产品,成本只比批量制造高10%,但回报至少2倍以上。年均销售收入、利润增长均超150%。

3.4 科技开发众包化

GE公司将喷气式发动机拖架设计要求与3D打印的设计工具公布在网上,鼓励创客社区参与设计,从56个国家和地区将近700件设计作品中选出优胜的设计,将重量减轻了85%。