系统仿真 半实物仿真

系统仿真(半实物仿真)
方法 提到研究方法,根据你所在学科的不同,一定能想到不同的名词 。
学理工科的,可能会想到实验法 。
学社会科学的,可能会想到问卷调查、访谈等 。
这里,我给你介绍一种稍稍另类的研究方法 —— 复杂系统仿真 。
1948 年,美国数学家,信息论的创始人之一 Warren Weaver 提出了 3 类科学问题划分 。

这三类问题分别是:

  • 简单问题
  • 无组织复杂问题
  • 有组织复杂问题
所谓简单问题,就是研究少数变量之间的关系 。例如你中学物理课学到过的,描述电阻、电压和电流关联的欧姆定律 。这一类问题,到了 19 世纪末,就已经能够被解决了 。

所谓无组织复杂问题,是指研究对象变量非常多,但是这些变量之间没有强联系,因此可以被近似当做一个整体来简单化处理 。
例如气压,它源自于数千亿无组织空气分子的运动 。温度和气压之间,是存在关联的 。
但是,我们要理解气压和温度之间的关系,是不需要一一考察那无数分子的个体情况,只需要把气压当成一个总体来处理就好 。这类的问题,到了 20 世纪中叶,也都获得了解决 。

聪明的你,一定已经想到了这最后一类 "有组织复杂问题" 的定义了 。
没错,如果我们的研究对象包括许多变量,而这些变量之间的关系不是微弱的,而恰恰是一种研究者不喜欢看到的 "强非线性" 关联,那么这类问题,就叫做有组织复杂问题 。
例如,小麦的价格如何确定?货币如何有效、明智与稳定地投放?
这些问题,历史上有无数的聪明人,希望通过明确的数学公式来一劳永逸地解决它们 。但是尝试过后,效果很不理想 。
更要命的是,我们生活的社会里,越是与真实情况相近的问题,就越是具备有组织复杂问题的特性 。不信你可以问问企业的管理者 。
那么,面对这样的问题,我们该怎么办呢?
社会实验肯定是解决的有效方法之一 。就如同历史上那些伟大的社会实验,例如:
  • 六度分割实验
  • 权威服从实验

问题是,不是什么时候,我们都可以选择社会实验法的 。这里就会涉及到科研伦理问题 。
例如说,我们要研究灾难发生时候逃生通道的情况,以便更好地设计安全的场馆;我们要研究病毒的传播路径,以便更好地防控疫情 。

这种灾难,显然不能在真实场景中进行实验,否则后果不堪设想 。
这就需要复杂系统仿真方法出场了 。
仿真 什么叫做仿真呢?
就是用一个模型,来模拟真实世界的情况,给出一个近似结果 。
仿真方法不稀奇 。就连数学上概率问题的抛硬币,你都可以用 R 语言来轻易实现一个仿真 。

以上抛硬币仿真代码来自这个地址 。
但是问题在于,对于复杂系统的仿真,和它是有区别的 。
前面提到了,复杂系统的特性,是变量多,而且具有强非线性关联 。
因此,这种仿真,对工具是有要求的 。即
  • 能够描摹个体的特性与行为
  • 能够刻画个体之间随时间步发生的交互作用
当然,如果你是高手,完全可以随便找来一种高级语言,从头开发自己的仿真工具 。就如同有些高手,一言不合,就喜欢拿起汇编语言自己编程玩儿 。

但是,这显然不适合普通人 。
作为普通人来说,我们最好还是使用别人搭建好的仿真框架,在上面运行求解自己感兴趣的问题 。
我做硕士毕业论文的时候,曾经使用过 Sante Fe 研究所开发的 Swarm 仿真工具,模拟无线局域网络中,通过作弊方式获得高带宽的用户行为 。

不过,当时的学习过程很痛苦 。因为 Sante Fe 研究所选用了一门当时非常冷门的语言作为 Swarm 的编程语言 。

好在风水轮流转 。后来,你可能听说了,这门语言被 Apple 看上了,一度成了开发 iOS App 的默认语言,又火了起来 。

只是那时候,我已经把好不容易学会的这门语言,给忘得差不多了 。惭愧 。
不过,Swarm 确实不适合普通人来入门复杂系统仿真,使用起来也不是很方便 。正如我在《学 Python,能提升你的竞争力吗?》一文中跟你提过的 。一门语言本身好坏固然重要,但更重要的,是网络效应,也就是有多少人愿意用 。
有良好的社区,你就能很容易学习,遇到问题也容易从同侪那里找到答案;有新的需求,也会有更多的可能获得积极响应和改善 。
所以后来,当我发现 Netlogo 的时候,很开心 。
工具 和 Swarm 不同,Netlogo 一上来的定位,就是让更多人,特别是非专业编程人员,也能很容易上手复杂系统仿真 。
究竟有多容易呢?
这么说吧 。你连安装软件都不需要 。
只要有一个浏览器,你就可以在里面输入这个链接:
https://www.netlogoweb.org/launch
然后,就能欢快地使用了 。

方便吧?
不但功能齐全,Netlogo 还具有非常丰富的文档 。

更让人兴奋的是,各种学科的模型样例,都很齐全 。这是长年以来,社区日积月累的结果 。

如果你要研究的问题,跟这些已经做好的模型相似,那么你只需要修改一下模型,就可以用于自己的研究 。
我之前做教育部项目,研究虚假信息传播的机制模型与应对策略 。其中一篇研究成果《基于复杂系统仿真的微博客虚假信息扩散模型研究》,用的基础就是 Netlogo 中的计算机病毒传播模型 。

里面模型运行出来,是这样的:

看到这里,你可能早已跃跃欲试了 。
别忙,刚才告诉你的,都是好消息那一面 。
坏消息是,Netlogo 的语法,非常古怪 。
对于从来没有接触过编程的人,困难在于模型一旦复杂化,阅读理解会有些困扰 。
然而对他们来说,这种语法的怪异倒还好 。他们的背景知识空缺,犹如一张白纸,往上面挥毫泼墨,还算容易 。只要功夫深,铁杵磨成针 。还是可以通过长期学习和反复练习来增强弥补 。
怕就怕你之前学过 C, Java, Javascript 或者 Python 这样的高级语言 。那初学 Netlogo 的时候,真的会让你有苦不堪言之感 。
你直觉上正确的语句,写出来几乎全都是错的 。
那感觉,肯定是不怎么样 。
为什么会这样呢?
因为 Netlogo 看似一个玩具语言,简简单单 。但是你千万不要被它的表象迷惑住 。它属于编程语言里一个非常古老而奇异的家族 ——Lisp 。
这个语言的其他亲戚,学起来也会让你觉得不那么直观 。
例如下面这段:

所以著名的漫画 XKCD 系列里面,是这样揶揄 Lisp 的:

但是,长得怪不要紧 。Lisp 这个语言家族的功能非常强大 。
如果你掌握了其精髓,那便如同会用了独孤九剑 。逢强则强,变化无穷 。
问题的关键,在于你如何学习它 。
教程 Netlogo 的教程,一直都很稀缺 。那些真正的专家,往往会过度低估 Netlogo 的入门和上手难度,只是希望把它作为工具,介绍复杂系统研究 。
例如 Melanie Mitchell 的课程,便是如此 。

在这些课程里,Netlogo 会被广泛用到,但是其功能使用的细节,不作为重点,很多地方一带而过 。你听着挺清楚,自己如果想要实践,或者需要定制修改模型,还是会一头雾水 。
直到 2015 年,Netlogo 的作者 Uri Wilensky,和 Bill Rand合作,才出了一本真正意义上的权威入门教程 。我当时在美国访学,书刚一出版就从亚马逊下单,买了一本,背了回来 。挺沉的 。

说是入门教程,也确实介绍了一些 Netlogo 的使用方法,但作者依然是把重点放在了介绍 Netlogo 在各种领域的研究应用上 。
更大的问题是,纸质的书籍,不适合做动态的讲解 。你图截得太多,显得冗余而凌乱 。图截得太少,可能会漏掉重要的步骤 。一切都靠读者领悟,读者学习的认知负荷就过高了 。
学习的过程中,依然有很多闹不明白的地方 。尤其是那些在其他编程语言里,习以为常的东西 。所以我不得不经常跳脱出来,到网上查询各种解法和经验 。
例如方括号和圆括号的使用,我就是看了这个帖子,才明白,还特意剪藏到了 evernote 中 。

连个括号使用,用户都会有这么多的疑问,以至于需要专门有人写个帖子来答复 。Netlogo 使用中坑洼之多,可见一斑 。
后来书的作者之一 Bill Rand 在 Sante Fe 的 Complexity Explorer平台开设了一门 MOOC,介绍复杂系统仿真 。我欣然加入学习,还获得了证书 。

有了这些教学材料作为基础,我试图在自己的《网络传播与舆情分析》课上,给研究生们介绍基于 Netlogo 的复杂系统仿真,以期让他们能够多掌握一种不同的研究方法,以便选题时视野更加宽广 。
但是,这一部分花了精力不小,收获却不大 。
因为学生们学起来困难重重 。
起初的上手教程,编个蚂蚁觅食,他们还是玩儿得不亦乐乎的 。

刚开始选练习题目的时候,也还算积极 。

但是一旦深入到了后面的复杂网络动力学部分,就基本上不求甚解,连蒙带猜了 。
为什么呢?
你可能想到了 —— 英语不过关 。
我推荐作为辅助材料的 Netlogo 视频教程,都是英文的 。学的时候,他们已经有好多地方跟不上,得反复回放了 。
到了练习中,遇到一些新函数,或者是方法的组合,都需要查资料 。而资料里绝大部分,也都是英文的 。
虽然我教给了他们如何查询编程手册,但是手册里面的使用方法,往往和实际应用里面的用法有区别 。对于初学者来说,这不是很容易处理 。
我就一直在想,如果能有一套中文教程,循序渐进介绍 Netlogo 的基础用法,把常见的坑一一指出 。然后再进一步,把避坑的方法娓娓道来,那该多好?
我曾经也想过自己做一套这样的教程,但是确实没有足够的时间和毅力 。
所以,当我看到集智学园出的这一套中文 Netlogo 教程时,非常惊喜 。

介绍 这部教程的作者,是集智学园的创始人,北京师范大学张江教授 。
张老师的课程,有一个特别好的地方,就是给那些曾经学过高级语言的人,讲了讲 Netlogo 奇怪语法与它们的区别 。

我曾经就是在这里,被卡得一塌糊涂 。
因为实在是不适应 。
他上来就说,为了学好 Netlogo,你得忘掉之前学的一切其他语言的语法,或者学会翻译它们 。
你看,这就是个教程里展示 "翻译" 的样例:

你可以学会用十几行代码,就构造出朗顿蚂蚁模型 。

然后,亲眼见证 10000 步左右涌现出的 "高速公路" 效果 。

你还可以通过最简单的 "羊 – 草" 生态模型,了解语句的上下文关系 。

对于没一个步骤,张老师都给出了非常清晰地介绍和图示 。尤其是对重难点做了非常细致的总结和梳理 。

通过一个简单的经济模型,你可以了解如何绘制动态直方图 。

甚至更进一步,用另一张图,动态绘制洛伦兹曲线 。

更妙的是,当我们需要考虑多个变量的交互影响或者综合因素时,还可以使用 Netlogo 给我们提供的简便实验环境 behavior space 。

在使用中,每一步都有详细的介绍说明 。使得你也可以让机器高速工作,帮你在短短的几分钟里面,做 2000 轮的实验 。

最终的结果,还能非常方便地导出 。

怎么样?是不是觉得学这样一套教程,很有意义啊?
你一定很关心价格吧?
没错,集智学园里面,有些课程确实要价不菲 。
但是这一门课程,是免费的 。

它是集智学园 “防疫助力” 课程的一部分 。这一板块里面全部课程,你目前都可以免费学习 。

怎么样?
是不是觉得这个漫长的假期,有事儿可做了呢?
小结 本文为你介绍了以下知识点:
  • 研究问题按照复杂度的分类方式;
  • 复杂系统研究的方法,尤其是仿真方法的必要性和应用场景;
  • 复杂系统仿真的工具 Netlogo 及其特点;
  • 入门 Netlogo 的优秀中文免费课程资源 。
点击这个链接,抓紧学习吧 。
我这样说,不是因为我当老师,有督促你学习的职业病 。而是有经验教训的 。
2003 年,我上大三的时候,曾经和许多同学一样,在一个周末,被学校要求在家自我隔离 。
当时我做的事儿,是把几年积攒下来的 DVD 看了个遍,很开心 。
但是,等到 6 月份宣布恢复上课和考试的时候,我就傻眼了 。前几天回看当时的日记,充满了惶恐与悔恨 。
要知道,其他同学在家里,利用那宝贵的假期时间,把互联网协议,就是那一堆 RFC 文件,从头到尾读了一遍 。
希望你,能珍惜眼前的时光,做到停课不停学 。用这些优秀的教程,填充你的知识结构,增长自己的见识和实力 。
【系统仿真 半实物仿真】

    推荐阅读