Pages

Tuesday, 27 November 2018

廉价劳动力如何推动中国的人工智能雄心

向中国科技目标推进的一些最关键工作,在中国中部腹地的一座原水泥厂里进行着,与北京和深圳那些向往成为硅谷的地方相距十万八千里。工厂院内还摆着一台闲置的混凝土搅拌机。隔壁的一座仓库里堆着一箱箱密胺餐具。
院子里,侯夏梦经营着一家帮助人工智能理解世界的公司。24个年轻人在浏览照片和视频,标记他们看到的每样东西。这是一辆汽车,那是一个红绿灯。这是面包,这是牛奶,那是巧克力。这是一个人走路的样子。
“我以前觉得机器很聪明,”24岁的侯夏梦说,“现在我知道,它所有的聪明都是我们给它的。”
在长期充当世界工厂的中国,新一代的低薪工人正在为未来奠定基础。在规模较小、成本较低的城市,创业公司如雨后春笋般涌现,他们在给中国海量的图像和监控录像添加标签。正如一位专家所说,如果把中国比做数据方面的沙特阿拉伯,那么这些公司就是炼油厂,它们将原始数据转化为可以为中国的人工智能雄心提供动力的燃料。
通常认为中国和美国正在争夺人工智能的霸主地位,而中国具有一定的优势。中国政府在财政和政策上广泛支持人工智能公司。2017年,全球计算机视觉市场中,中国创业公司占了三分之一,超过美国。中国的学术论文在研究论文中被引用的频率更高了。在去年的一份重要政策声明中,中国政府表示,预计到2030年,该国将成为人工智能领域的全球领导者。
更重要的是,这种想法认为,多亏了薄弱的隐私法律及其执行,中国政府和公司获得了堆积如山的数据。在Facebook、谷歌和亚马逊已经积累的数据之外,中国互联网公司能获得更多,因为那里的人们太常用他们的手机购物、支付餐费,以及购买电影票。
然而这些说法中的许多是存疑的。中国的论文和专利可能存在问题。政府的钱可能会被浪费掉。目前还不清楚人工智能竞赛是否会是一场赢者通吃的零和博弈。除非有人能够分析和归类,否则数据是无用的。
但标记这些数据的能力,可能是中国真正的人工智能实力,也可能是美国唯一无法匹敌的力量。在中国,这个新兴产业提供了一个政府长期承诺的未来的一瞥:一个建立在科技而非制造业基础上的经济。
“我们这些人属于数据行业里的建筑工人。我们做的事就是垒砖头,一块一块地垒,”中部省份河南郏县一家数据标签工厂的联合创始人伊亚科说,“但我们在人工智能中扮演着重要角色,没有我们,他们无法建造摩天大楼。”
虽然人工智能机器是超快的学习者,擅长处理复杂的运算,但它们缺乏就连5岁的孩子都具备的认知能力。小孩子们都知道棕色的可卡犬和黑色的大丹犬都是狗。它们可以分辨一辆福特皮卡和一辆大众甲壳虫,但还无法了解二者都是汽车。
人工智能需要被教导。它必须消化大量带有标签的照片和视频,然后才能意识到,黑猫和白猫都是猫。这就是数据工厂及其工作人员起作用的地方。
标记帮助北京的人工智能公司AInnovation完善其为一家中国面包连锁企业提供的自动收银系统。用户可以将糕点放在扫描仪下,在没有人类帮助的情况下付费。但有三分之一的时候,由于商店照明和人体运动,图像变得更加复杂,系统无法分辨玛芬蛋糕、甜甜圈或叉烧包。AInnovation项目经理梁睿表示,标记在使用商店内部照片的情况下,准确度高达99%。
“有多少人工就有多少智能,”梁睿说。
AInnovation有不到30个标记员,但标签初创公司的激增使得把工作外包出去变得很容易。有一次,梁睿为超市做标签,需要在三天内拍摄大约20000张照片。同事们在数据工厂的帮助下,只花几千美元就完成了工作。
“我们就是10年前流水线上的工人,”河南那家数据工厂的联合创始人伊亚科说。
数据工厂开始在远离大城市的地区涌现,通常是在相对偏远的地区,劳动力和办公空间都很便宜。许多数据工厂的工人都曾在大城市的流水线和建筑工地工作。但是那些工作正在枯竭,工资增长放缓,而且许多中国人更喜欢住在离家较近的地方。
36岁的伊亚科失业后听说了人工智能标记,那时他试图和小学同学一起做别的公司。在网上搜索后,他认为这项工作技术性不强,只需要廉价劳动力,而这正是河南不缺少的。
三月,伊亚科和朋友们成立了睿金科技,该公司以每年2.1万美元的价格在工业园区租用了两个专业篮球场。它以前是园区党委会的活动空间,吊顶灯上覆盖着红色的镰刀锤子图案。
睿金的意思是智慧黄金,它现在雇佣了300名工人,但计划在春节假期后扩大到1000人,春节期间,很多农民工会回家乡。
与世界各地的工人和企业不同,伊亚科并不担心人工智能会取代他的工作。
“机器还没有聪明到自己教自己的程度,”他说。
招聘是一个更大的麻烦。
睿金每月400至500美元的薪酬高于郏县的平均水平。一些潜在的求职者担心自己对人工智能一无所知。也有人觉得这项工作很无聊。
19岁的靳炜祥表示,他将在春节后离开睿金,到南方城市广州一家实体店卖家具。
“我喜欢和人打交道,”靳炜祥说。“做标注就是挣点钱。”
但对于一些以前的农民工来说,这项工作比在流水线上工作要好。
“工厂里每天是一样的活,一样的动作,天天都一样,”曾在一家电子元件公司工作的睿金员工、28岁的伊真真说。“现在得稍微动动脑子。”
大多数情况下,客户不会告诉数据工厂,他们的工作是用来做什么的。有些是显而易见的。比如标记交通信号灯、道路标志和行人,它们通常用于自动驾驶。标记许多类型的山茶花可能是给搜索引擎用的。
有一次,睿金得到一个任务,为数百万个人类的口部图像做标记。伊亚科说他不确定这是用来做什么的。也许是面部识别?
大约向北300英里的河北南宫市,侯夏梦经营着一家数据工厂,由她婆家拥有的一间旧水泥厂改建而来。她在大学毕业后的第一份工作是给旷视科技做面部标记,这是一家价值20亿美元的中国面部识别公司,其最著名的技术平台名为Face++。到目前,一些面部识别系统可以比识别她的朋友更快地识别她,她说这是因为“我的脸在原始数据库里。”
但北京的生活太过艰难而且昂贵。她和当时的未婚夫赵亚成决定搬回家乡做数据工厂。她的父母可以出电脑和办公桌的费用。他们正在翻新隔壁的仓库,再雇用80多名员工。
像伊亚科一样,侯夏梦并没有花时间思考自己的工作所带来的影响。它们是否有助于国家的监视,以及机器控制人类的反乌托邦未来?
“摄像头让我感觉安全,”她说。“最起码现在是我们在控制机器。”

No comments:

Post a Comment