时常思考

0 写在前面

　　在学校开设的《学科技术前沿讲座》课程中，MSRA的邹欣老师为我们发表了一场精彩的演讲。

　　在演讲的最后，他为我们提出了三个值得思考的问题，在这里我记录一下这三个问题，并给出我的思考与解答。

　　欢迎感兴趣的朋友留言交流讨论~

1 选手的中奖率会提高嘛？

　　在一个游戏中，主办方在三个门中任选一个，在门后放了一个奖品，另外两个门之后是空的。选手要在三个门中选择一个抽奖。当选手选择了一个门，未曾打开门之前，主办方打开了另外两个门中没有奖品的那个门，并向选手说，他可以改变他的选择，即转为选择剩下一个没有打开的门。请问，如果选手此时改变选择，他会提高或降低获奖的可能性么？提高多少？请给出你的分析。

直观感知

首先需要我们对这个问题中所提到的一些假设和前提有一个明确的理解。
- 备选的三扇门对于选手来说，它们的信息是相等的，也就是说，选手在第一次选择的时候，选择任何一扇门的概率都是相同的。
- 主持人是有先验知识的，他是知道哪扇门背后是有奖品的，因此主持人关闭的门必然是一扇没有奖品的门。
因此当主持人关闭了一扇门的时候，相当于向系统中注入了新的信息。

我们不妨将题目范围扩大，假设现在有10扇门，那么主持人会关闭掉其中的8扇门，只留下两扇门。在这种情况下，我们不难有一个直观感知--显然此时选手如果改变选择的话，会提高其获奖概率。
定量分析
在我们已经确定了选手此时如果改变选择的话，他就能提高获奖的概率的前提下，接下来，我们通过计算，来给出他获奖的概率具体能提高多少。

如果选手一开始选择的门是有奖的，这个概率为1/3，那么在主持人关闭门后，他不改变选择的中奖率为1，改变的中奖率为0
如果选手一开始选择的门是无奖的，这个概率为2/3，那么在主持人关闭门后，他不改变选择的中奖率为0，改变的中奖率为1
因此不改变选择的中奖率P=1/3 * 1 + 2/3 * 0 = 1/3;而改变选择的中奖率P=1/3 * 0 + 2/3 * 1 = 2/3
综上所述，改变选择的中奖率会提升1/3

2 中文房间有智能嘛？

　　如何看待 “中文房间” 问题，中文房间有智能么？它有什么样水平的智能？如何才能让它具有人类水平的智能？　　

　　1980年，美国哲学家 John Searle 提出了世界十大思想实验之一的“中文房间”问题，这个实验要求你想象一位只说英语的人身处一个房间之中，这间房间除了门上有一个小窗口以外，全部都是封闭的。他随身带着一本写有中文翻译程序的书。房间里还有足够的稿纸、铅笔和橱柜。写着中文的纸片通过小窗口被送入房间中。根据Searle，房间中的人可以使用他的书来翻译这些文字并用中文回复。虽然他完全不会中文，Searle认为通过这个过程，房间里的人可以让任何房间外的人以为他会说流利的中文。

　　这一思想实验是Searle用来指出图灵测试在验证智能方面并不是完备的， John Searle 认为，如果一个机器中的核心部位都不了解自己传输的数据是什么含义，那么整个机器就更不可能有意识和智能。

　　尽管如此，我对这个问题的理解是，中文房间是有智能的，但这种智能是一种较低水平的“弱智能”。

　　以人类的大脑结构中的神经系统组织做一个类比来看，神经系统在传导信号的时候，难道它们懂得这些信号的含义吗？大脑的某个细胞在储存记忆所需的化学物质的时候，它本身懂得这些记忆吗？很明显，一个细胞或一些细胞是不可能“懂得”任何东西的，就像中文房间实验中的那个不懂中文的人，但这些细胞组成的大脑却可以有思维和意识。

　　因而从这个角度上来说，我可以认为中文房间是有智能的，但另一方面，由于中文房间只是根据一种特定的文字映射关系完成了字符串的转换，而并没有真正意义上的“理解”他所需要翻译的内容，而我们知道，对于人类的语言而言，语义和语言背后的隐含意义，如隐喻、暗讽、双关等等，这些意思，都是中文房间所难以理解和表达的。因此，中文房间智能被称为是一种较低水平的“弱智能”。

　　为了让中文房间具有更高水平的智能，我认为可以从以下两个方向去努力：

扩大训练样本规模：数据规模往往在很大程度上决定了训练的效果，对于中文房间而言，要让它能够理解语言，最好的方式，就是将更多的人类交际场景引入到训练样本中，使之能够在原有的语言翻译的基础上，能够根据上下文语境给出具体的反应。
增强自我学习能力：对于“智能”的定义而言，人类相较于机器来说，最大的区别，就在于人类对新事物的认知有着很强的自我探索和学习的能力。另外，对于任何语言而言，变化是一个永恒的话题，没有任何一种语言是一成不变的，对于中文来说，外来词汇、新生词汇、网络流行语等等，都在不断的重新塑造着汉语。因此，为了使中文房间能够在智能的水平上有所提升，可以引入自我学习算法，使之能够对于中文语言中的新元素有着更强的适应性，从而达到更高水平的智能。

3 你能用NABCD模板设计一个项目嘛？

　　既然这门课讲了很多计算机前沿，那么学生就可以预计一下这些前沿知识如何能给普通用户或某个行业带来好处。学生根据讲课的内容和参考文献，用 NABCD 的模板，描述你心目中一个使用了 “人工智能+其他前沿技术” 的创新项目。这个项目应该是由 7 - 10 名有相关技能的大学生在 4 个月能完成。

　　【我的设计】

Overview
- 项目名称：基于多任务学习的商业选址推荐系统
- 应用技术：人工智能 + 数据可视化技术 + 系统开发
Need
　　商业选址是一类重要的投资决策问题。其重要性主要体现在投资的长期性、固定性以及对经济效益的决定性上。在传统的商业选址问题中，通常的考量因素往往涵盖了地域、交通、竞争压力以及人流量等方面。在这种情况下，投资者的经验以及数据信息来源的有效性将起到决定性的作用。随着移动互联网时代的到来，越来越多的商业应用，如美团、大众点评等渐渐走入人们的生活。这其中蕴含着巨大潜在的商业价值有待挖掘，尤其对于商业选址这类重要的问题而言，数据所提供的参考信息已然成为大数据时代的选址利器。

　　　　　为此，可以设立一个项目，为商业选址提供推荐方案。

Approach
- 将连锁品牌的投资选址问题，抽象成一个数学问题来进行解释。
- 我们从多源异质数据，如POI、用户产生数据UGD和行人流量数据HMD中提取特征。
- 以多指标联合评估为目标。
- 采用多任务机器学习的方法给出推荐方案。
Benefit
- 综合考量商业区内部与外部特征。
- 充分利用用户产生数据UGD。
- 用多任务交叉学习分析源数据之间的共享表征来代替传统的运筹学方法和决策者经验给出预测。
- 在系统架构上，该项目结合了模型的数据特点和方法特点，让投资者对呈现的数据进行交互式分析，加入平面与立体结合以及动态可视化效果，让商场的商业分布、地理以及行人行为特征得以更充分的展现。
Competitors
尽管近年来商业选址预测案例屡见不鲜，但传统的推荐方法在有效性方面，仍存在一定的瓶颈。首先，在数据来源上采用多为调查问卷和店铺运营数据。其次，在评估方法上多以最大化店铺覆盖面积为目标，推荐方案大都依赖于传统的运筹学方法和决策者经验，导致大量的用户产生数据UGD没能得到有效利用。

在数据来源上，这一项目可以从海量UGD中提取出与选址评判相关的86种特征，并整合成内部与外部两类特征。其中内部特征包括商圈POI数目、商场竞争性与互补性特征等47种特征。外部特征包括商场周边的人流量信息、交通流量信息以及消费行为分析等39种特征。

在输出端，本项目运用多指标联合评估给出推荐方案的排序。根据模型预测结果，绘制出投资预测的五维雷达图，按照其指标进行排序，生成推荐方案。

在方法上，我们采用的是基于深度神经网络的多任务学习的模型架构，充分利用源数据之间的共享表征，来考虑不同任务之间的关系进行多任务交叉学习。为了验证模型的效果我们在理论应用上开展了大量实验。
Delivery
- Web端和手机移动端同步发布
- 通过主流招商网站平台进行推广
- 召开发布会对产品进行介绍与宣传
- 保持对平台和系统的运行与维护
- 美化UI提升用户体验，吸引更多投资者和潜在用户使用本项目提供的商业选址平台。

4 总结

　　对于学科前沿知识，要时常保持关注，同时尝试将领域知识应用于实践。正所谓“实践是检验真理的唯一标准”，唯有不断实践，不断总结，不断思考，才能不断提高。

原文地址：https://www.cnblogs.com/chrischen98/p/10728782.html

时间： 2024-11-05 22:07:00

时常思考

0 写在前面

1 选手的中奖率会提高嘛？

2 中文房间有智能嘛？

3 你能用NABCD模板设计一个项目嘛？

4 总结

时常思考的相关文章

军旅风电商崛起：砺剑户外用品深度调查

[知乎有感] 读研到底为了什么，值不值得？

三十岁的程序员，反思这五年的代码生涯

万丈高楼从地起

刻意练习的一次尝试

软件测试职业规划的思考

关于大型网站技术演进的思考（五）--存储的瓶颈（5）

近来的思考

连载《一个程序猿的生命周期》- 40、张弛有度的工作，留给自己一些思考的时间