首页 资讯 正文

山西省高速公路200MW分布式光伏项目:打造“光”景靓丽的“绿色电力长廊”

体育正文 260 0

山西省高速公路200MW分布式光伏项目:打造“光”景靓丽的“绿色电力长廊”

山西省高速公路200MW分布式光伏项目:打造“光”景靓丽的“绿色电力长廊”

山西省永和县唯一一家电影院,开在主干道(zhǔgàndào)的路边,距离(jùlí)靳红艳上班的数字人才中心只有约200米。 “你是什么模型?”“我感觉我都要忍不住笑出来了(le)。”“其实你可以改进一点的,你讲得太快了,而且(érqiě)你讲的故事没有感情。” 5月底,在山西省永和县一个靠着黄土坡的小楼里(lǐ),这些语音条在一位数据(shùjù)标注员的电脑上一一跳出。 数据标注员是位30岁上下的女人,她挂着耳机,紧盯屏幕,移动鼠标,敲击键盘(jiànpán)。她要查看机器给出的语音转写是否正确,如果有误,反复回听,确认字句,作出(zuòchū)修改,或给出“方言严重”“噪声(zàoshēng)太(tài)大”“多人同时说话”等标签。这是在给机器“改作业”的过程。 有人说,机器变得聪明和这个干旱(gānhàn)的小城有些许关系。 在头部互联网(hùliánwǎng)公司参与AI数据标注工作的张佳佳告诉中青报·中青网(zhōngqīngwǎng)记者,外包团队标注好的大量数据将被交给算法(suànfǎ)工程师,再次“喂”给机器,进行下一步训练。如此重复训练,机器将会(jiānghuì)越来越能听得懂人话。 数据,要人类进行属性标注后,才对机器产生意义(yìyì)。 5月26日,山西省永和县数字就业(jiùyè)中心里,正在工作的(de)AI数据标注员。 在山西省永和县这个数据(shùjù)标注(biāozhù)基地里,给(gěi)人工智能“打工”的(de)业务持续了5年。从最简单的——圈出图片中的“苹果”“水杯”“箱子”开始,到观看一段与股票基金涨跌相关的视频,从中提炼出(tíliànchū)信息。由易到难,一条数据标注的单价(dānjià)从1分钱到20元不等。5月底,在一组数据标注员教AI听人说话的同时(tóngshí),还有十几位标注员专注面对人脸,精准标出眉毛、眼睛、嘴唇;十几个人一整天(yīzhěngtiān)在盯着智能货柜的实时抓取画面,看人手里拿的商品与机器给出的答案是否吻合——一人一天要点击约2000次。 大量数据对(duì)人工智能认识、理解世界有重大作用,是华人科学家(kēxuéjiā)李飞飞在13年前向世界证明的。 2012年,一个名为AlexNet的(de)算法成为新一届ImageNet大规模视觉识别挑战赛(tiǎozhànsài)的冠军。 这种学习方法可以理解为(wèi)一种(yīzhǒng)笨方法,例如用千张各种(gèzhǒng)小提琴的照片,让机器“认”出小提琴,整个项目总计需要约2000万张图片,可能需要从数亿张图片中筛选。 数据标注行业流行着一句话,“有多少智能(zhìnéng),就有多少人工”。 大约2007年(nián),在斯坦福大学的李飞飞寻找人工时,想到的办法是用时薪10美元的价格招募本科生,但用这种方案,完成这个项目需要(xūyào)19年。后来,一个允许全球(quánqiú)用户加入的众包平台上,近5万名标注者参与其中(qízhōng),帮助完成了(le)这个有划时代意义的实验。有人说,没有这个数据集,“就没有现在的深度学习革命”。 这个经济不算发达的(de)永和县,数据标注员们感知到自己标记的数据在改变世界的时候不多。生活中,也很少有人(yǒurén)关心(guānxīn)他们在这做什么,比起训练(xùnliàn)人工智能,更重要的是获得了一份工作。这些数据标注员多是中专及以下学历,约90%是女性,在县城,她们看中这个工作双休、坐在办公室,允许把放学的孩子(háizi)接过来写作业。 5月25日,山西省永和县,两条(liǎngtiáo)主干道交叉口。 2020年,人工智能(réngōngzhìnéng)训练师(shī)正式成为新职业,纳入国家职业分类目录。数据标注员是(shì)人工智能训练师的工种之一。冯琴和李瑞琴都是在这一年成为数据标注员的。 几年(jǐnián)中,李瑞琴(lǐruìqín)“最稀奇”的一次体验是,给无人驾驶汽车业务做道路标注任务时,居然有一次看到了永和。图片上是一个熟悉的路口,是她去丈夫老家(lǎojiā)村子的必经之路。她想,说不定很久之后, AI汽车也会(huì)到这儿来。 AI汽车此刻距离永和县还有点远。这两年,这里一小半(yīxiǎobàn)业务来(lái)自各类无人驾驶汽车项目,数据标注员们(yuánmen)眼前是采集车收集来的各地路面图片,他们要标出红绿灯、车道、行人、路障(lùzhàng)。从路标来看,图片大部分来自“南方的大城市”。 永和(yǒnghé)县城只有两条主干道。除了大型货车,路上最常见的交通工具是摩托车(mótuōchē)——城区狭小,四面环山,电动车难骑上附近的陡坡。冯琴说,只需要10分钟,就可以骑着摩托车贯穿县城。永和县(yǒnghéxiàn)是山西省人口最少的县,少见6层以上的高楼,吕梁(lǚliáng)山脉留给这个县城的建设(jiànshè)空间不多。两条主干道的交汇处,是县城最大的活动广场,她们的办公室就在广场对街不远处,是县城的核心位置(wèizhì)。 在这个县城,这家公司属于高新科技(kējì)企业。永和县工信局、科技局局长冯利对中青报·中青网记者介绍(jièshào),这家科技公司是目前(mùqián)县城中唯一一个数字技术相关的企业,县里其余与科技有关的工作,大部分是农业技术指导(zhǐdǎo),对接农技人员和农业合作社。 在屏幕之外,这些AI数据标注员们面对的是一个传统的世界(shìjiè)。 王丽娜也是在2020年成为一名数据标注(biāozhù)员。十几年前,王丽娜高中毕业去(qù)了太原,在太原打拼5年。在4S店做销售时,她(tā)最高拿过一万元的月工资,但工作也忙,很少(hěnshǎo)走着去上班,总是一溜小跑。和人打交道很累,“得让人把(bǎ)钱花了,还得让人高兴”。下班了,还得随时接客户电话,解决售后问题,提供情绪价值。 那(nà)段时间虽然累也充实,“上的是社会大学”。她回县城(xiànchéng),更多是因为结了婚,生了孩子,走不开了。她和丈夫开了个家具店搞装修,但(dàn)因为永和县城楼房少,生意不太好,没干下去。 那(nà)几年,王丽娜陷入郁闷的(de)情绪:“没意思。”“就窝在这个县城了,不顶事了。” 回想起来,是AI数据(shùjù)标注员这份(zhèfèn)工作让她慢慢接受了在县城的生活——体面、收入在县城不算低,又不用像在外地打工一样那么拼。她的状态慢慢好(hǎo)起来。 也是为了家庭,冯琴在(zài)2008年回到了永和县。她(tā)曾经在北京做过几年(jǐnián)的(de)教育培训。回到永和县,最不适应的是这里一些人缺乏时间观念,说好了时间开会,没人到。她在一家小加油站做了几年会计,总要熬夜。2020年找到这份AI数据(shùjù)标注员(yuán)的工作,因为业务方多是杭州、上海的互联网公司,她找到了一种在大城市工作的熟悉感,高效、规范,她挺享受这点。 冯琴也很享受这份(zhèfèn)工作的“新奇”。做了一些金融(jīnróng)相关的任务(rènwù)后,她第一次买了基金。她曾跟随公司(gōngsī)来到上海参加人工智能大会,走在东方明珠附近的一个路口,她发现曾在无人驾驶汽车业务的图片标注上看到过这里,“就是(jiùshì)这,这不是一模一样吗?”大会上集中展示了还未被广泛采用的AI技术,以至于在2025年春晚上,看到机器人在舞台上转手绢时,她感觉(gǎnjué)“一点都不稀奇”。 在DeepSeek成为热议话题的一年前,冯琴就知道了什么是(shì)“大模型”。来自互联网公司的业务方会要求他们给“大模型”业务单独分出一个组(yígèzǔ),对标注员学历的要求是大专(dàzhuān)及以上。 在末端,永和县的标注员们感受到的是,这两年,他们不需要教AI认苹果(píngguǒ)、水杯了。任务走向(zǒuxiàng)“深层次(shēncéngcì)”:画出苹果的框是不够的,要用文字描述出“这是一个什么样的苹果”。 数据标注员靳红艳印象深刻的任务包括:把一句话改写得(dé)押韵;从一些信息中总结出一个成语;听一段(yīduàn)语音,语音中是两人(rén)在就保险理赔(lǐpéi)问题吵架,判断说话人的态度情绪。王丽娜印象深刻的任务是,阅读4篇童话故事,投票哪一篇写得最好,并说出理由。 作为项目经理,王丽娜开会时会(shíhuì)和大家解释,现在的简单任务越来越少,“因为你已经把(bǎ)机器人教会了”,这是必然。 2024年年初有行业报告预测,2024年大模型(móxíng)应用将进入落地期,垂直领域(lǐngyù)大模型的商业化应用正在加速。 也是(shì)大约2023年年底开始,冯琴的老板李林峰感觉到,越来越难给永和县(yǒnghéxiàn)的标注团队找业务(yèwù)。不是市面上没有业务,而是团队成员的学历、背景达不到要求。要求本科学历,甚至(shènzhì)有汉语言、医学、法律等专业背景的需求越来越多。数据(shùjù)标注员们手中的任务在变少,从前同时做3个任务,现在只剩一个,薪水(xīnshuǐ)随之下降。最近的绩效冠军大约能拿4000元月薪。 人工智能的(de)进化还在持续。张佳佳告诉中青报·中青网记者,“AI时代怎么(zěnme)到来?必定是要把我们的时代交给它,它才能成长起来,各个领域(gègèlǐngyù)的知识去大量地涌进它。”她说,未来,各行各业的专家(zhuānjiā)都是人工智能所需要的标注员、训练师。 2025年年初,一位研究生学历的记者转行进入AI公司做AI人文训练师,着重教大模型与人文社科有关的知识、能力。在训练人工智能的体系中,她(tā)处在外包数据标注员的上游,是(shì)制定标注规则的人。不过她说,从一开始(kāishǐ)她就明白,这个工种的职业生命(shēngmìng)短暂。 最近,她在(zài)教一个大语言模型写新闻(xīnwén)评论。经过多轮提示、修正,她很快感觉,模型写出的(de)评论质量超过自己,“这是肯定的,我(wǒ)的目的就是让它做到这一点”。她觉得教AI和教孩子很像,希望他成为什么样的人就怎样教他。参与构建一个美好的AI世界,可以是一种热忱的理想,但她不(bù)懂技术,自觉能做的有限。想到未来AI不再需要她去训练的那一天,她说“该(gāi)怎么办怎么办”,也说不定又会有新岗位出现(chūxiàn)。 比起教(jiào)AI,永和县的数据标注员们(yuánmen)将更多的心力花在真正的孩子上。她们也享受着人工智能的成果(chéngguǒ),向豆包、DeepSeek和Kimi求助如何(rúhé)辅导二年级的孩子英语、如何写作文,怎么写毕业典礼上的家长发言。 不过王丽娜也希望,“机器也别发达得太厉害了(le)”,给以后的孩子(háizi)们一些机会。 在(zài)“内卷”中的(de)数据标注(biāozhù)行业,永和县的AI标注员们有着“佛系”气质,流动性不(bù)强,员工不知道自己做任务的单价,也很少去打听。老板李林峰还没结婚,一些员工因此相信他会把更多的钱花在公司里,比如给每个办公室买了按摩椅。县城小,很多同事一开始不认识,细聊后才发现两家人沾亲带故(zhānqīndàigù)。冯琴说,小县城重人情世故,几年前春节期间(qījiān)接过协助机器识别“福”字的任务,实时任务,需要3秒内判断,需要加班(jiābān)。没有多少人愿意在春节期间加班。 李林峰说,再以后的时代是,人工智能给人类(rénlèi)赚钱,人只需要护理机器,享受生活。他想到永和人的性格就是这样——在经济发达的地方,或许(huòxǔ)有更多比较,但在永和,一家大商场都(dōu)没有,没什么可比的,更享受当下。至于自己会不会被取代(qǔdài)?他觉得所有人迟早(chízǎo)都会被取代。 新技术曾经给县城里的(de)女人们带来过一段美好时光。 前两年,这家AI数据标注公司在常住人口仅4万多的县城(xiànchéng)轰动一时,最多时有170多名员工(yuángōng),有人曾经拿(ná)过万的高薪,有人在丈夫的工作困顿时成为家里的顶梁柱。那时大家手头宽裕,周末,这些教AI识字、看图的女人们常常会(huì)三五成群聚餐。冯琴说,有次她在县城里一家(yījiā)饭店吃饭,一看,饭店里全是她们公司的人。 最近,有的数据标注员去考(kǎo)了函授大专,提升学历,有人(yǒurén)考了AI训练师资格证。虽然有人觉得,考这些也(yě)没啥用,还是达不到业务不断更新的要求。 快40岁的靳红艳不怎么有(yǒu)危机感,前两年,她在县城开(kāi)了一家电影院,能作为另一份职业。电影院也在这条街上,是县城唯一一家电影院,只有一个影厅。她白天做(zuò)AI数据标注(biāozhù)员,晚上(wǎnshàng)和周末排些电影。如果AI有一天彻底不需要她做标注了,她会成为一个全职的电影院老板,放映更多场次电影。 (应受访者要求,张佳佳为化名(huàmíng))
山西省高速公路200MW分布式光伏项目:打造“光”景靓丽的“绿色电力长廊”

欢迎 发表评论:

评论列表

暂时没有评论

暂无评论,快抢沙发吧~