99%的人不知道,Word是可以自动写文章的。。。

论坛 期权论坛 期权     
差评   2019-7-14 17:07   1925   0


本文授权转自公众号:苯宝宝公开课
ID:PhenoClass

相信差友们都有过赶作业或者被催稿的经历。。。





面对上图这样的界面发呆数小时,什么都写不出来,这种事肯定人人都干过。


如果你是程序员,那么界面应该是黑的~



据不严谨统计,99% 的脑力劳动者有对空白的软件屏幕有恐惧心理,100% 的人认为自己的工作速度低于人类平均值。



要交的文章和代码,不到 deadline 当日 23:59 是不会交的。。。


不过们不用灰心丧气,我们膜拜的大佬,黎曼啊,胡适啊,余华啊,也拖延的。


拖延是人类公敌,因此出现了如下的表情包。。。









是啊,都 8102 年了,人类的科技这么发达了,火箭上天早就不是事儿了,可是我们居然还要和自己枯竭的创造力作斗争,居然还没有软件会自己码字、作图、编程?!



怎么办??


其实早在 100 多年前,没有电脑更没有 word 的时候,有个人就懒得自己码字了。。。


他就是下图的 Emile Borel。





他对他的打字机说:“ 你是个成熟的打字机了……”



然而打字机没有理他。


于是他想到了一个办法:让猴子来打。。。




Borel 掐指一算,假设猴子在 26 个字母和空格这 27 个键上随机乱按,不考虑大小写和标点什么的,每次按 60 下,那么有大概 7600000000000000000000000000000000000000000000000000000000000000000000000000000000000 分之一( 这里有 85 个 0 )的概率能码出一首特定的 60 个字符的俳句。


也就是说,如果派 1000 只猴子来打字,每分钟按 60 下,那么平均等大概  150000000000000000000000000000000000000000000000000000000000000000000000000000( 有 76 个 0 )年,就可以打出某首特定的 60 个字符的俳句来了!


如果我们不要求猴子写出大作家的作品,而是弄出像样的、能看懂的俳句就好,那么需要的时间还要少。如果我们的需求高一点,要它们打 140 个字的微博,或者莎士比亚的十四行诗,那么要等的时间就更长一点。


这个概率非常低,但是无论如何它是一个正数,不像面对任务发呆的我们,什么都写不出来,对不对?



其实数学上,即使概率为 0 的事件都有可能发生。


比如由于点是没有面积的,飞镖打在靶子的特定某点的概率是 0,但是飞镖总是会打在某个点上。 一个事件概率为正数,那不管这个正数多么小,已经不得了了。


这个故事告诉我们,如果想写书、想搞大新闻,直接码、直接搞就对了。干掉空白的屏幕是所有任务的关键一步,在脑子里空想,我们不如一群猴子。。。


后来 Borel 成为了现代概率论的先驱,被主页菌等学概率论的人尊称为大师兄,二战后他去了 UNESCO( 联合国教科文组织 )。他的妹子,人称 Camille Marbo,是一位特别高产的作家,写了 30 多本小说,同时为反战和女权作出了杰出的贡献。


谁也不知道他们是怎么克服拖延的,不过应该没有找猴子帮忙。。。



人工智能时代的 “ 成熟软件 ”


A. A. Markov 是和 Borel 齐名的现代概率论先驱。他早年认为数学应该是纯粹的,但是后来慢慢觉悟到,把数学应用到文学等领域也挺有意思。


他的观点是,Borel 的猴子和打字机之所以效率不高,弄出好东西的概率极低,是因为猴子的每次按键都被认为是独立的:猴子按下一个键的时候,每个键被按到的概率相同,都是 1/27,猴子们并不在意上一次按了什么。



但是人类的语言不是这样的。正常的语言里,字母和字母、单词和单词之间都有顺序上的关联。

比如英语里字母 s 后面更容易跟 t 而不是 x;在法语里,如果出现了字母 x,下一个字符就有极大概率是空格了( 法语中 x很 容易出现在单词末尾 )。从单词的角度说,一般的语言里如果出现了动词,下一个词更有可能是名词,而出现另一个动词的概率与之相比就小很多。


Markov 想,如果猴子每次的按键不再独立,而是考虑之前打过的一个或几个几个字符,以此猜测下一次( 或者下几次 )按什么,也就是之前的行为影响之后的行为,一环套一环,这样就可以迅速生成有意义的话了呀。



这个想法呢,就是今天风靡科技界的 “ 马尔科夫链 ”


从天气预报到谷歌的搜索算法,从物理学的粒子运动到生物学的 DNA 测序,都要用到它。


Markov 用这一套方法研究了普希金的诗集,研究了普希金写下 N 个字母的时候,接下来的N个字母更可能是什么。然而,在 Markov 的年代,如此受训练的猴子不太可能实现,自己会码字的打字机只是一个理论上的构想。


但是今天我们有了计算机,就可以用马尔科夫链生成普希金风格的诗了!见下图 ——




如果程序一个字母一个字母打,打出来的东西和乱码没啥区别。如果 7 个字母 7 个字母打( 也就是每打 7 个字母,猜猜普希金下 7 个字母会写啥 ),就会大段大段抄袭普希金的原话。当我们处于中间情况,5 个字母 5 个字母打的时候,程序就能生成带有普希金风格的好诗了~~



现在有很多用了马尔科夫链的自动写诗应用。差友们感兴趣可以扫下面这个码试试。



我也顺便就用这个东西生成了一首 Robert Frost 风格的诗:

他的尾巴羽毛脱落。
他只需要飞!
但他觉得她很好,
并且说他知道:
她走在树上
褪色的地球
这让星星变亮了
竭尽全力吧!
他告诉她,
永远吹嘘的爱情;
竭尽全力吧!

所以差友们看,可以自己码字的成熟软件其实并不遥远,人工智能写诗也不是什么高科技。。。


然而。。。


这好像和我们想要的,叫它码啥它码啥的 “ 成熟软件 ”,还是差了不是一点点。


马尔科夫链最好的成果,最多就是模仿一种文风,表现差一点的话,要么就是抄袭,要么就是产生乱码。而且如果没有人类诗人的作品作为训练数据,马尔科夫链是什么也干不了的。。。



那么真的可能出现取代所有人类脑力劳动的 “ 成熟软件 ” 吗?我觉得悬。


毕竟,面对空白屏幕、空白草稿纸发呆的那一秒一秒,才是人类创造力的真正光辉啊。。。


“ Model the beauty of the world. ”

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:2
帖子:16
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP