专题·活动|中巴农业与产业合作|巴中特快|最新|

吴晨光:人工智能时代的媒体新在哪里

2018-10-16 16:52 来源:经济日报-中国经济网  

编辑推荐

网络传播视听节目许可证(0107190)
 (京ICP证140554)
微信图片_20210901143254.png
93690678-ffdd-4ec1-8403-f7947db2af1f.jpg

吴晨光:人工智能时代的媒体新在哪里

2018-10-16 16:52 来源:经济日报-中国经济网

一点资讯总裁、知名媒体人 吴晨光(中国经济网记者 张相成摄)

  谢谢杨老师,我记得跟杨老师认识,大概有六年时间了,当时我们还是在一个杂志一起做传统媒体。从这个杂志离开之后,我到了搜狐网先做总监,然后做搜狐网的总编辑。今天主要要讲的是一点资讯,这六年我其实就做一件事情就是转型,从一个传统媒体人转向一个新媒体人,从一个生产内容的人,转向对内容生产和内容分发两个环节之间的关系做研究的人。另外我觉得在转型里边,在座的有跟我一样的传统媒体人,我分享经验,其实你们在跟算法架构师沟通的时候整个思维模式是不一样的,传统媒体人的思维还停留在计划经济里,今天主办方给我的题目我稍微改了一下,人工智能时代的新媒体,人工智能时代的新媒体究竟新在哪里?

  我先讲一下我最初结识人工智能的一个小故事。

  以前单位有个男生,平时工作不错,就是喜欢上班时看一些影视片,被我抓到过几次。后来,这个男生就找到一位算法架构师,问问能不能想办法不让我再抓到他。算法架构师说,这事很简单,看我的。第一在我的办公室门口安上了一个摄像头,我一出办公室摄像头就能拍到我,第二摄像头连到男生的电脑上,并在他电脑里面装了一个系统,叫人脸识别系统,在网上搜索我的照片,放在他的电脑里面,让人工智能人脸识别系统,对我脸轮廓的辨认,这样我一出办公室,他就能看到我,从此之后我再也没有抓到这个男生。

  当然,这个故事纯属虚构。我想通过这样一个故事告诉大家三个重要的概念。第一个概念是什么,就是故事里面说的主题,以前这个同事,偷偷看着我怕我出办公室,现在不用看着我了,背对着我坐的,让人工智能帮他做这件事。你们去百度的话,定义很长一串,就是让机器干人干的事,大家使用最早人工智能的应用是什么?各位,一定不是电脑,我小时候没有电脑是计算机,以前的话我们算算术,都是靠人,笔算口算都是靠人,计算机把这个事帮你干了,就是人工智能的应用之一。今天人工智能应用不是简单的计算器。前一段时间特斯拉出事情了,无人驾驶撞死人了。一会儿讲到的关于人工智能在我目前领域里的应用,我不是研究动作片的,我是研究信息流分发的。还有前一段时间一直很火的,而且新的阿尔法狗比旧的聪明一百倍,战胜了李世石和柯洁。人工智能做的最好的公司是Google公司,有一个Google大脑的机构,是做人工智能的,在中国本来百度是要OE人工智能,百度陆奇离职转回搜索这块了。

  我故事里也讲到了,要收集很多我的照片,进入到电脑进入到我们的人脸识别的系统里才能够识别我,要不停的通过我脸部的数据辨别这个轮廓,叫机器学习,教会他,教小孩1+1=2,慢慢的把加法口诀和乘法口诀告诉他,他就知道原来7+2=9,让机器不停的学习,数据输入的越多,算法越好,学习越快。还有一种叫无监督学习,半监督学习,我把资料发给大家,大家自己去学,还有深度学习,今天我们不是来讲一些概念的,总之就是玩命的学。在讲人工智能在我所在的信息流分发的领域概念之前,我们先从这个故事讲人工智能的几个小概念。

  到了我自己研究的领域,我们来看一下人工智能在一点资讯或者在今日头条千人千面的客户端分发是怎么去使用的,大家看三个源泉,这个是先有什么东西,我们按照汉字的阅读习惯,是从右向左,我在里面先讲的是什么东西,先讲的是用户画像,在传统媒体里面,我们先讲的是文章画像,不管以前我是在南方周末工作也好,根据内容选择用户。有了人工智能我们的媒体发生了翻天覆地的变化,就是先有用户画像,我把这个形容是什么呢?其实这是一次巨大的变革,就是像当年我们从计划,经济向市场经济的转变,我们知道今年是改革开放四十周年,1992年小平同志视察南方的时候提出来中国要走有中国特色社会主义经济。我上大学的时候,还是要带着粮票去买东西,因为我去食堂,我是1992年进入大学的,1992年邓小平南巡之后,所有的粮票布票废除了,像今天一点资讯和今日头条一样的,每个人看到的东西不一样,根据喜好不同分配不同的信息,首先是先有用户画像,用户画像是什么呢?很简单其实就是一句话,你喜欢什么?大家来看一下这个图,大概有几个维度来构成,第一个维度你在那里,因为我知道你在大兴区温泉里,我给你推荐,根据用户的画像,你的地理位置给你推送信息,精准程度,比你推送北京市效率高很多。第二个你使用什么样的手机,使用手机12800多的和300多红米手机的人绝对不是一个群体,这两个人对信息的要求是不一样的。第三你在进入一点资讯的时候,你会填一个用户注册的基本信息,有了你的身份证,第一你的家乡在哪里,哪里人,第二是男还是女,第三你的年龄是什么,通过这种注册信息,判断这样一个人群,自然属性的人群喜欢什么,最主要的最上面那个层次,你在微信里也好,你在一点资讯,你喜欢的浏览器抖音快手,你天天刷的,点击评论分享收藏订阅你所有的信息记录在服务器里边,记录在后台,判断你喜欢什么,不喜欢什么,一个非常重要的这样的数据指标,于是你的用户画像通过这几个层次逐步的丰满,一点资讯对你的用户画像刻划的越精确,三年时间一点资讯,人工智能为什么很精准,懂得你是谁,PC端,没办法按照千人千面方式去分发,因为不知道你是什么样的用户,三年我们逐步的细化四项蔚蓝的概念,是什么概念?发生3.5级的地震,推送到周边多少公里的地方才会引起大家的关注,3.5级,4.5级,5.5级每一级别的地震,你在手机上搜到的是不一样的。

  第二尊重用户的主动表达,点击转发分享收藏评论等都是用户的一种表达,用户在上面画小叉,你不喜欢这个稿源,不喜欢这个类型的文章等这些东西,你表达了不喜欢,就像我说我爱你,你别来追我,用户主动表达喜欢和不喜欢都会在后台记录下来,但是我们要根据这个东西去详细的分析。点击率10次点击的数目多,用户更喜欢吴晨光搜索是主动的行为,可能更喜欢杨锦麟,在这样一个环境下,我们做出什么样的分析和评判也是算法模型在不断进步的一个结果,第三个我们说到的这个把握用户的一个阅读规律,这里面涉及到很多东西。晚上推送一个什么样的东西,中午推送什么样的东西,很多自然的属性,逐渐的加入到我们对用户的刻划里面。还有最后一个就是我跟大家讲,这叫人以类聚,我跟杨老师我们前十条阅读的内容,八条是重复的,第十一条内容推给我,我阅读的可能性比随便一条推给我的高很多,认为我们俩的阅读习惯是相近的。这属于协同过滤,总之在这几年里面我们不停的对算法进行精细化的这样的一个运营和提高,而背后积累的或者我们的依据就是用点击数据整体的提升。我们再看一下关于内容画像的维度,这个比较简单,我们知道用户是喜欢什么样的文章,我们还要找到一篇这样的文章,然后给他送过去,这里有几个维度关于题材这个不说了,上面大家一看,现在题材很多,因为有了互联网。第二是作者,每个作者代表不同风格,我的公号和杨老师的公号是完全不同文章。第三是标签,到底文章是写什么的?是写市政的、社会的、财经的、科技的还是写体育的,如果是写体育的话,到底写足球、篮球还是排球,如果是写篮球是NBA还是CBA,教会机器怎么去识别。

  最后一个是质量,我们不能把乱七八糟的东西推出来,尽管它的点击率可能会比较高,我们在这里通过人工评判一下,这个自媒体账号一点资讯有8万个,这个里面涉及到一级到六级,一级是最差六级是最好的,文章的画像输入的越多,它对文章的判断其实就是越精细,除了判断我上面说的这几个维度之外,文章的温度,文章的态度的理解,包括对文章下面网友留言的理解,都进入人工智能学习的这样一个体系里边,而大家看到了?更多的数据来自于哪里,来自于大家UGC的上传,在快手,人工智能进步很快,上传五到六百万条小视频,在快手的视频里不但能辨别一幅图像,视频画面里出现的是人还是狗,这个狗是金毛还是藏獒。准确理解你喜欢什么不喜欢什么,快速理解你喜欢什么不喜欢什么,你使用一个APP,两年才理解你,你早把它卸载了。第三个一定把好的文章,精的文章推给用户,而不能只给用户推给用户点击率低的,垃圾档的文章,不能陷入点什么推什么减防效应,作茧自缚,兴趣去泛化,准快精和宽对我们算法最终效果基本的一个衡量,算法最难的是什么?我和杨老师是朋友,不能每天随时理解他,算法也是如此,算法做得好,对人性这样的一个理解,所以在这块人工智能信息流分发领域道路还有很远的路要走。我们都学过基本的数据,生产力、生产资料、生产关系,我刚才谈到了你需要输入十万张照片,到人脸识别系统,所以去年在乌镇互联网大会,马云和我在一个论坛上,马云就说现在我们要重新定义这几个概念,大数据是非常宝贵的资料,为什么呢?因为大数据是人工智能辨别各方面的一个基础,所以它是一个新的对生产资料的一个定义。

  生产力因为有了人工智能,极大提升我们的分发效率,一点资讯靠我们老编辑判断,对重大新闻的判断,新闻里面,新闻很重大,判断地很准确,点击率大概也就是十八,用人工智能去分发,知道他喜欢什么给他推什么,在同一个位置,最上面的一条,这个点击率可能达到50%到60%,典型提升生产效率,所以我们就说生产力,就是这样被提升的,包括区块链极大地提升生产力,重新定义生产力其实是跟人工智能有关的,PC端是不了解你的地理位置,包括很多的习惯,PC端不是每天跟随你,所以很难了解你的社交圈子,到了移动互联网,每天跟着你,非常能够了解你个性的就相当于你人体的另外一个器官,所以我就说生产关系其实是通过互联网和移动互联网进行了重新构建,最后的话要给我们这些媒体人,人工智能的人提出新的要求,要求其实以前我刚才说到了,十几年的从业这样的经验里面,我更多的是专注做内容生产,我们之前一直在讲内容为王,但是在这个图画里面内容只是其中之一,内容放在那里,就像我们要喝矿泉水拿一个瓶子喝一样,产品就是那个瓶子,瓶子放在那里,放在我们刚才说到的,APP是我们的渠道之一,三横一竖构成一个王字,加上一点就是用户,理解了用户才能真正理解人工智能,理解了大数据,用户的行为习惯构成了大数据,人工智能这个概念才能有没有数据是不可能形成人工智能,你要想主宰天下的话,很重要的要能够把用户的数据收集起来,所以我们就说今天能不能再做出一个抖音快手,即使有一定重量级的总编辑,数据没有积累到一定程度,很难再复制。今天的环境下,一般媒体人也做不出第二个南方周末、凤凰卫视的道理是一样。

  最后跟大家分享一下我出了一本新书《自媒体之道》,全书的核心是什么,就是我刚才说到的关于内容生产和内容分发之间的关系。比如说内容分发每天有多少用户读,用户每天读什么样的文章,用户第二天今天读了明天还会不会来,七天之后还会不会来,来了三十天之后还会不会来?用户阅读的系数,在内容分发里面,我们的内容生产集中在大量的自媒体UGC上传,放到没有UGC和自媒体上传,数据积累不起来没法做人工智能,我们每天有多少自媒体作者,进入我们体系里面,每个作者生产多少篇文章什么样的属性,我们最终是在两者之间寻求一个平衡,我们把内容分发,多少用户比成水的话,自媒体内容生产就是鱼,多少水养多少鱼,两者之间形成生态平衡的效应,而不是失衡。假设我的用户特别特别多,但是我的UGC只有两篇稿子,那么用户就会全走了,如果每天有80万篇文章,进入体系里,都是优质文章,但是用户只有几个人,就没有点击没有广告。我们现在满足一个什么东西?人民日益增长的美好生活的需要和不平衡不充分发展之间的矛盾,先把平衡维护好然后保持一个水源的清朗,把更多优质的内容展示出来,人工智能也好,大数据也好,给我们今天整个文态平衡的治理提供一个重要的依据。

(责任编辑:项佳丽)