99%的人不知道，Word是可以自动写文章的。。。

本文授权转自公众号：苯宝宝公开课
ID：PhenoClass

相信差友们都有过赶作业或者被催稿的经历。。。

面对上图这样的界面发呆数小时，什么都写不出来，这种事肯定人人都干过。

如果你是程序员，那么界面应该是黑的~

据不严谨统计，99% 的脑力劳动者有对空白的软件屏幕有恐惧心理，100% 的人认为自己的工作速度低于人类平均值。

要交的文章和代码，不到 deadline 当日 23:59 是不会交的。。。

不过们不用灰心丧气，我们膜拜的大佬，黎曼啊，胡适啊，余华啊，也拖延的。

拖延是人类公敌，因此出现了如下的表情包。。。

是啊，都 8102 年了，人类的科技这么发达了，火箭上天早就不是事儿了，可是我们居然还要和自己枯竭的创造力作斗争，居然还没有软件会自己码字、作图、编程？！

怎么办？？

其实早在 100 多年前，没有电脑更没有 word 的时候，有个人就懒得自己码字了。。。

他就是下图的 Emile Borel。

他对他的打字机说：“ 你是个成熟的打字机了……”

然而打字机没有理他。

于是他想到了一个办法：让猴子来打。。。

Borel 掐指一算，假设猴子在 26 个字母和空格这 27 个键上随机乱按，不考虑大小写和标点什么的，每次按 60 下，那么有大概 7600000000000000000000000000000000000000000000000000000000000000000000000000000000000 分之一（这里有 85 个 0 ）的概率能码出一首特定的 60 个字符的俳句。

也就是说，如果派 1000 只猴子来打字，每分钟按 60 下，那么平均等大概 150000000000000000000000000000000000000000000000000000000000000000000000000000（有 76 个 0 ）年，就可以打出某首特定的 60 个字符的俳句来了！

如果我们不要求猴子写出大作家的作品，而是弄出像样的、能看懂的俳句就好，那么需要的时间还要少。如果我们的需求高一点，要它们打 140 个字的微博，或者莎士比亚的十四行诗，那么要等的时间就更长一点。

这个概率非常低，但是无论如何它是一个正数，不像面对任务发呆的我们，什么都写不出来，对不对？

其实数学上，即使概率为 0 的事件都有可能发生。

比如由于点是没有面积的，飞镖打在靶子的特定某点的概率是 0，但是飞镖总是会打在某个点上。一个事件概率为正数，那不管这个正数多么小，已经不得了了。

这个故事告诉我们，如果想写书、想搞大新闻，直接码、直接搞就对了。干掉空白的屏幕是所有任务的关键一步，在脑子里空想，我们不如一群猴子。。。

后来 Borel 成为了现代概率论的先驱，被主页菌等学概率论的人尊称为大师兄，二战后他去了 UNESCO（联合国教科文组织）。他的妹子，人称 Camille Marbo，是一位特别高产的作家，写了 30 多本小说，同时为反战和女权作出了杰出的贡献。

谁也不知道他们是怎么克服拖延的，不过应该没有找猴子帮忙。。。

人工智能时代的 “ 成熟软件 ”

A. A. Markov 是和 Borel 齐名的现代概率论先驱。他早年认为数学应该是纯粹的，但是后来慢慢觉悟到，把数学应用到文学等领域也挺有意思。

他的观点是，Borel 的猴子和打字机之所以效率不高，弄出好东西的概率极低，是因为猴子的每次按键都被认为是独立的：猴子按下一个键的时候，每个键被按到的概率相同，都是 1/27，猴子们并不在意上一次按了什么。

但是人类的语言不是这样的。正常的语言里，字母和字母、单词和单词之间都有顺序上的关联。

比如英语里字母 s 后面更容易跟 t 而不是 x；在法语里，如果出现了字母 x，下一个字符就有极大概率是空格了（法语中 x很容易出现在单词末尾）。从单词的角度说，一般的语言里如果出现了动词，下一个词更有可能是名词，而出现另一个动词的概率与之相比就小很多。

Markov 想，如果猴子每次的按键不再独立，而是考虑之前打过的一个或几个几个字符，以此猜测下一次（或者下几次）按什么，也就是之前的行为影响之后的行为，一环套一环，这样就可以迅速生成有意义的话了呀。

这个想法呢，就是今天风靡科技界的 “ 马尔科夫链 ”。

从天气预报到谷歌的搜索算法，从物理学的粒子运动到生物学的 DNA 测序，都要用到它。

Markov 用这一套方法研究了普希金的诗集，研究了普希金写下 N 个字母的时候，接下来的N个字母更可能是什么。然而，在 Markov 的年代，如此受训练的猴子不太可能实现，自己会码字的打字机只是一个理论上的构想。

但是今天我们有了计算机，就可以用马尔科夫链生成普希金风格的诗了！见下图 ——

如果程序一个字母一个字母打，打出来的东西和乱码没啥区别。如果 7 个字母 7 个字母打（也就是每打 7 个字母，猜猜普希金下 7 个字母会写啥），就会大段大段抄袭普希金的原话。当我们处于中间情况，5 个字母 5 个字母打的时候，程序就能生成带有普希金风格的好诗了~~

现在有很多用了马尔科夫链的自动写诗应用。差友们感兴趣可以扫下面这个码试试。

我也顺便就用这个东西生成了一首 Robert Frost 风格的诗：

他的尾巴羽毛脱落。
他只需要飞！
但他觉得她很好，
并且说他知道：
她走在树上
褪色的地球
这让星星变亮了
竭尽全力吧！
他告诉她，
永远吹嘘的爱情;
竭尽全力吧！

所以差友们看，可以自己码字的成熟软件其实并不遥远，人工智能写诗也不是什么高科技。。。

然而。。。

这好像和我们想要的，叫它码啥它码啥的 “ 成熟软件 ”，还是差了不是一点点。

马尔科夫链最好的成果，最多就是模仿一种文风，表现差一点的话，要么就是抄袭，要么就是产生乱码。而且如果没有人类诗人的作品作为训练数据，马尔科夫链是什么也干不了的。。。

那么真的可能出现取代所有人类脑力劳动的 “ 成熟软件 ” 吗？我觉得悬。

毕竟，面对空白屏幕、空白草稿纸发呆的那一秒一秒，才是人类创造力的真正光辉啊。。。

“ Model the beauty of the world. ”