数学将震撼你的世界 --------------------------------------------- |
上一辈的数理专家们使金融界发生了天翻地覆的变化,现在他们又在策划广告大战,并且开始从堆积如山的个人信息中构建新的业务 |
尼尔・戈德曼是一位数学企业家。在他所工作的华尔街,数字为王。但是,他却将他的分析手段瞄准了另外一个完全不同的领域:文字世界。
由戈德曼所创建的信息技术公司(Inform Technologies LLC)是一家自动化图书管理公司,公司的系统每天都要阅读数以万计的英文报刊文章和博客网站,把相互关联的片段分为一组。信息技术公司对文章分析归类时并不是按照字母顺序或搜索关键词的方式,而是利用一定的运算法则,对文章的语言和上下文进行分析,然后向用户发送为其量身定做的新闻。实际上,这些用户也是以数学的方式存在于该公司的系统之中。
如何把书面文字变为数学呢?戈德曼说这就要把代数和几何学结合起来运用了。想像一个物体漂浮于太空之中,每一条已知信息都组成它的一条边。这个物体就叫一个“多面体”,它的面接近无穷,我们普通人几乎无法构想出来。这个多面体包含了报刊中所有的主题。信息技术公司处理的每一篇文章都会成为多面体上的一条直线。每条直线都有一系列的相互关联。举例来说,一篇关于波尔多酒的文章在“多面体”上会与“法国”、“农业”、“酒”甚至“酗酒”这些词语比较接近。信息技术公司则通过测量两条直线之间的夹角来衡量一篇文章与另外一篇的相关程度。
现在,当你阅读这些词句时,这篇文章也会以一条直线的方式存在于戈德曼的多面体上。这就提出了一个基本问题:如果一篇长篇大论,即使其中充满了起承转合,也都能被简化成一个数学的要素,那么接下来还有什么可以被简化呢?那就是我们的商业活动以及我们自己。
世界正在进入一个数字新时代。数学家与计算机科学家正联手开拓全新的商业领域,充分发挥数学的效率。这事有先例可循。在过去的几十年间,高等数学与计算机建模紧密结合,改变了科学和工程学。上一辈的数理专家们曾将金融界闹得天翻地覆。数据采金人从大量的消费者和商业数据库中采集捡选出有价值的情报。再看看现在数学家们在干什么:他们帮助公司策划广告宣传,他们改变了新闻编辑室和生物实验室的研究性质,他们使营销人员得以打造与客户之间的一对一关系。随之而来的是,越来越多的经济领域正在落入数字王国。美国国家安全局(National Security Agency)所属的数学研究小组负责人詹姆斯・沙茨说:“数学家们的光景从没有这么好。”
从信息技术公司这样的新兴创业公司到IBM之类的技术行业巨头,所有公司都在努力把数学与商业联系在一起,其联系方式在几年前看起来甚至还有些异想天开。过去10年来,相当数量的人开始在网上工作、娱乐、聊天以至购物。我们向网络输入了大量的数字化信息,这些信息曾一度被搁置在小纸片上,或消失在被遗忘的对话中。现在我们生活中的这些片段被保存在数据库中,许多都成为公开信息。从商业角度看,它们迫切需要分析。但是,如果不能招聘到有技能的数学家和计算机科学家,即使有了功率最强大的计算机和充足的廉价存储器,公司也没有能力将日益膨胀的数据海洋进行分析归类,更不用说利用它们发展业务了。
随着数学的兴起,市场对杰出的数理专家的需求日渐升温,特别是在互联网巨头公司,一个数学系毕业生的起始年薪就达6位数,此外还有丰厚的股权。麻省理工学院应用数学教授、企业家汤姆・莱顿说:“我所有的学生都得到了雅虎和Google的任职邀请。” 顶尖的数学家们正在成为一支崭新的全球精英队伍。尽管根据猜测,这批人尚不足5000人,但从哪一点来看都不逊色于曾经呼风唤雨的哈佛大学MBA。
与此同时,数学企业家们也迅速积攒了巨大财富。15个月前,信息技术公司的尼尔・戈德曼将其以前创立的以数学为基础的财务分析公司“资本智商”(CapitalIQ)以2.25亿美元的价格出售给标准普尔公司。去年5月,阿密特和巴尔拉基 ・辛格两兄弟将其经营的为遗传学开发计算方法的Peribit网络公司出售给Juniper网络公司,售价达3.37亿美元。
在被数据所充斥的世界里,我们自身就成为这些数学怪才最珍视的样本。安泰保健(Aetna Health Care)、亚马逊网站和许许多多其他公司的研究人员正在拼搭客户和雇员的数学模型。有些模型预测我们可能会买哪些音乐制品,另外一些模型则分析哪位工作人员最适合哪个岗位。目前,这些模型还很原始,相当于简易的线条勾勒。但是,再过10年,我们每个人都会获得一个更加有血有肉的仿真模拟的自己。我们将被塑造成工作人员、购物者、选举人和患者。有些仿真模拟数据还会附上我们的姓名和信用卡,甚至一些基因资料。而在其他的数据中,这些表明身份的信息将受到屏蔽。上述这些林林总总的数据模型有的万分精准,有的异常离谱。尽管如此,公司和政府仍将充分利用这些模型预测如何向我们推销产品、怎样指导我们预防疾病并提高生产力。毫无疑问,它们还将千方百计地利用这些模型防止劫机和爆炸事件的发生。
这种模拟人的数学模型将成为21世纪最伟大的一项事业。随着数学家越来越多地获取新的数据,这种模型的范围将日益扩大直至将物质世界的大部分包括进去。数据来源可能来自大气感应器,也可能来自数以百万计的摄像头的回传数据。就像一个平行的世界正在成型,又像一个为创新和发明而设的实验室,只不过这个实验室是由数字、向量元素和运算法则组成。总部设于科罗拉多州博尔德的Umbria公司运用数学在线分析营销趋势,首席执行官霍华德・考尚斯基说:“我们把物质世界变为数学,也把你变为数学。”
黑暗的一面
这一产业化的形态变化也有黑暗的一面。数学家们对个人信息赋予含义,找出个人的行为模式,这些做法将不可避免地侵犯到个人隐私。商家将能够追踪我们很私密的购买信息,雇主不但可以用生产效率还能用浪费了多少分钟来对我们进行排序。除此之外,数学的兴起使人们感觉到个人力量的渺小;也使人们预感到数学能清楚地勾画出我们的命运, 从我们的信用等级到我们的基因图谱。
过去10年中,对此类问题的争论爆发过很多次。布什政府曾下令对电话和互联网通讯进行探查以求嗅到恐怖分子的蛛丝马迹,随着美国国会对此事展开调查,这类争论肯定还会再度出现。但尖端的数据采集与高等数学相结合也可以产生巨大力量从而攻克人类疾病。按信息技术公司首席技术官杰克・艾因霍恩的说法:“下一个‘乔纳斯・索尔克’(小儿麻痹症疫苗的发明者――译注)会是一位数学家,而非医生。”
数学的撼动力在广告业表现得最为明显。Google和其他建立于数学基础之上的搜索公司正在将一个根植于理念、直觉和人际关系的行业变为一系列计算。它们之所以能够引领这一行业,原因非常简单:它们知道潜在的客户在浏览什么、点击什么、也常常知道他们在买什么。网络公司不但使用这些数据建立客户档案,还能搞掂更多的合同。大约18个月前,一个名为“互动广告社”(Interactive Advertising Bureau)的行业团体着手对宝洁、迪士尼等30家蓝筹股公司进行测试研究。这些研究对消费者数据进行处理,以衡量广告在众多媒体上的效果。反馈回来的全是确确实实的数字。例如,数字显示,福特汽车如果将其在线广告预算比例由2.5%提高到6%,则其卡车销售能提高6.25亿美元。福特对此响应积极:去年8月,该公司对外宣布,在其10亿美元的广告预算中,针对个人消费者的媒体广告开支比例将提高到30%,其中一半将投入在线广告。
伊姆兰・卡恩是在线贷款公司――E-Loan公司搜索广告部主任。身为一名训练有素的会计师,卡恩将广告运作变成了一间巨大的统计实验室。正如行业中大多数人一样,他于3年前开始在各大搜索引擎中对关键词进行投标。到现在,卡恩的团队已经积攒了25万个关键词和短语。只要网上冲浪者在搜索引擎中输入这些词语,E-Loan的广告就会出现在搜索结果旁边,卡恩的团队会为每一次点击按投标价付费。不过,以搜索为基础的广告运作可不是一个静止的过程。卡恩与靠分析起家的硅谷企业Efficient Frontier公司联手,对其词库进行细致的分析处理,对每个词语的投资回报率分别进行计算,随时抓住数千个标的。卡恩每年在这方面的开支是1500万美元,这相当于E-Loan公司广告预算的一半,卡恩由此积累了大量客户反馈信息。
随着数据专家对客户信息积累的逐渐增多,他们的力量也强大起来,并开始要求从内部推进公司的变革。拿媒体行业来说,随着消费者数据库的不断膨胀,负责营销方面的数理专家就可以向编辑和节目制作人提供日益复杂的统计模型,告诉他们哪类电视场景或文章对某一类人群最具吸引力。随着出版商追求利润和绩效的最优化,数据分析变得越来越重要。但也由此产生了风险:它使得基于数学的分析师在编辑决策中的作用不断加强。位于旧金山市的营销进化公司(Marketing Evolution)创始人雷克斯・布里格说:“这使人对传媒业传统的‘政教分离’产生了疑问。”
日益增加的信息流使各公司有能力靠信息的引导追踪个人消费者。互联网上的营销人员自然是领头人,不过传统行业也不甘落后。赌场业巨头哈拉斯娱乐有限公司(Harrah's Entertainment Inc.)的首席执行官加里・洛夫曼曾为哈佛商学院教授,他引导该公司为数以百万计的顾客建立了个人档案。档案模型包括赌客的年龄、性别和邮政编码,还包括他们花在赌博上的时间和输赢情况。这些数据使公司得以通过大量的变量研究赌博,也可以针对个人提供各种不同的优惠活动,从周末度假到美食飨宴。而这些优惠活动都是经过计算做到了利润最大化。过去5年间,哈拉斯公司的年均增长率高达22%,其股价几乎涨了近两倍。
天空中的π
同样,数学还能改变调查行业。不管是在法律界、新闻界还是进行犯罪调查工作,人们长久以来一直靠人脑在各种毫无联系的证据中拣选并发现各类模式。福尔摩斯有时候要在烟斗的缕缕烟雾中才能有所发现。难道不是这样吗?即使在今天,也没有任何机器能从照片、姓名、文字、地理坐标和录像片断这样堆积成山的被计算机科学家称为“非系统性数据”中筛分出有用的信息。
但有些公司已有所突破。科罗拉多的Umbria公司建立了一套系统,实时搜索数以百万计的博客网站,寻找市场情报。Umbria公司将英文信息分解为最小的成份――单词、短语、文法、甚至情感,然后将其转化为数学。随后,该程序对内容进行分析,总结出趋势。它可以向无线通讯公司或快餐馆提供人们对一则广告或一款新口味的三明治的最新反响。
有时候它所发现的趋势甚至超乎研究人员的想象。例如,最近为“佳得乐”运动饮料(Gatorade)所做的一项研究显示,大批年轻人视其为调制鸡尾酒的饮料,他们希望这种运动饮料中的电解质能缓解宿醉。将来,类似的发现还会揭示无数其他模式。这些发现可能帮助银行家识别濒临破产的企业家,或提示警察哪些反叛者正在策划恐怖行动。
位于加州森尼韦尔的雅虎公司办公室中,首席研究员普拉巴卡尔・拉嘎万领导着一个由100名数学家和计算机科学家组成的团队。拉嘎万在一块写满等式的白板上涂画着,宣称以雅虎两亿名注册用户的在线活动为主要内容的巨大的数据储备,是雅虎最宝贵的资源。他相信尚有大量商机有待发掘。当雅虎发现了新方法来满足这些客户的要求、好奇心和渴望时,这些商机就会成为现实。这些未来业务的线索就漂浮在雅虎数据的海洋中。拉嘎万的任务就是对那些数据进行梳理筛选,并找出消费者、电子商户和广告发布人之间的联系。他说,更好的运算法则“是生存下去的关键”。
随着公司持续不断地接收关于其生产过程及工人的新数据,许多公司都会运用数学来提高生产力,并重新组合工作场所。此举不只局限于一个公司。全球范围的大型项目可以通过建立模型来进行任务分割,并将分割后的每个任务块都交给最合适的人选。总部设于巴黎的ILOG公司能够将客户的原始数据转变为可视图形,并预先设定虚拟装配线,该公司的首席执行官皮尔埃・哈伦说:“我们将建立起这样的系统,它能以分钟为单位挖掘信息,这样生产力会以10的倍数增长。”
这听起来更像是天空中数字化的π。其实,这实际上是IBM等公司半个世纪以来一直在运用的数学模型的延伸。二战以后,IBM的研究人员为公司的供应链建立了一个包含原材料、运输时间表及制造车间等内容的数学模型。工作模型完成之后,IBM对其进行数学分析,名曰“最优化”。根据分析结果会提出专门的改进建议,重新调整之后,IBM的经营效率大大提高,成本下降。几十年过后,“最优化”成为IBM服务业务的一个支柱。今天,IBM咨询师正运用数学手段来改进中国的钢铁厂,并重整美国邮政服务的运作。
如果你回顾一下原来的供应链程序,一项重要的要素在其中几乎消失:人。人以数字体现,并且在很大程度上是可互换的。由于缺少数据,数学家们设计的模型无法使之具体化。不过,即使收集到大量的数据,当初那初级的计算机也无法承受。
现在,在纽约市以北半小时车程的IBM研究中心,一个由40名研究人员组成的团队正在对人进行仔细研究。该团队中有数据采集员、统计员和运营分析专家。现在的项目是将原有的供应链程序重新进行调整,然后运用于IBM服务部门的5万名咨询人员。也就是说,他们建立模型的对象是同事,而非机器、熔炉或者进度表。
此项目的负责人是生于叙利亚的萨默尔・塔克里提。他是从安然公司的数学工作室跳槽过来的。在安然的财务风波将公司搞垮之前的若干年间,该公司领先探索高等数学领域,以求开发新的金融交易。IBM于2000年,即安然土崩瓦解的前一年,再次雇佣了塔克里提,任命他为随机分析高级经理。这份工作要求将随机行为包括人类的随意漫游都归纳进数学模型之中。
塔克里提说,建立IBM劳动力模型的第一步是将公司各种记录中的所有数据都收录进来。到目前为止,这些专业人员被分为200个类目。但数学团队还在寻找更丰富的个人信息。塔克里提说,对公司电子邮件调查一下,就会找出雇员之间的信息交流纽带以及他们之间形成的非正式交际网络。相互之间电子邮件往来频繁的工作人员应该可以在工作上更好的协作。日程表的数据可以显示哪个咨询人员有更多空余时间。最后,利用汽车追踪装置,系统能够确切地知道各个咨询人员的所在地。因此,当接到一个合同,比如在马尼拉新建一个呼叫中心,IBM的最优化系统可以在它的全球数据库中精选组建出一支完美的团队。
未来的微积分
上面提到的计划可能要经过数年的时间才能得以实现。“人是复杂的,” 塔克里提说,“你有政策,他们就有对策。机器绝对应付不了。”这就意味着研究人员得把某些人为因素考虑进去,这可能将使设立的模式更加模糊。尽管如此,如果IBM的运作取得成果,它一定会向它的客户提供类似的劳动力管理模型服务。
最终,类似IBM这样的程序迟早会影响到我们。而它要走向何方也不难猜测。经理们运用这些工具,不但可以监控雇员的绩效,还可以监视他们的一举一动来驱使他们提高生产率。他们甚至有可能象网上卖家一样,运用工具把这些权利与销售收入或投资回报联系起来。另一方面,消费者也获得了前所未有的丰富信息,从房地产市场的预测模型到以病人死亡率图表为依据比较肿瘤专家。
这是一个到处充斥着数字的时代。使学生具备适当的数学技能是学校董事会和各国教育部所面临的严峻考验。在美国,这点尤为重要。美国各大学和各大公司研究实验室工作的数学天才多为外国人。即使在“9・11”后,外国人获取留学签证更加困难的情况下,估计在美国的两万名数学毕业生中也有半数是在国外出生的。从计算机科学到工程学许多其他以数学为基础的职业也有类似情况。
现在美国面临的挑战是双重的。一方面,国家必须在本土培养一流的数学家,特别是当外国人发现在美国以外更容易找到机会时。这就要求重新修正教育,鼓励更多的女生和少数族裔学生学习数学,让更多的学生学习使用微积分,这是进入数学殿堂的入门训练。麻省理工学院数学系负责人麦克尔・ 希普色说:“这与我们技术团体的未来息息相关。”同时,各学区应该注重在更广阔的人群中培养数学方面的悟性,为将来的商业社会作准备。在将来的商业社会中,数字会不断地出其不意地出现。这可能需要适当地增加数学课程,开设更多的应用学科,如统计学。
私生活
数学革命最重要的一项挑战就是:通过数据发展新的商机而又不牺牲个人隐私。如果客户、患者和工作人员担心自己的生活私密细节在数据库中散播,那么他们很可能会想方设法封锁自己的信息或从网上抹去信息。这就有可能扰乱我们利用数学并从数据中发掘有用信息防治疾病、打击恐怖主义。现在的目标是建立一个体系,在共享团体信息的同时保护个人信息。例如,研究人员在利用HIV或乳腺癌患者的数据库时,可以从年龄、种族、收入、药物治疗、教育和社区等各个方面入手,而不要专注于某个人。
数学家们正处于这场隐私之战的中心。在邻近旧金山市的微软公司实验室,加密员欣西亚・德沃克正在研究设立一套系统,以求在使用数据的同时能保证屏蔽个人信息。德沃克和她的团队使用被称为“噪音”的数字伪装对每条个人记录进行保护。就好比看一张人群的合影。当你放大其中一张脸,它就变得模糊不清。这一方法有望成功,但德沃克也承认有数学天份的黑客还是可以撬开她和她的团队紧闭的大门。她说:“作为加密员,我们知道对手的力量。”
数学还有没有其他的问题?有时候它并不像宣传的那么好用。当数学家们将其领地扩大到人类时,他们使用的新数据很多是未经检验的。Google公司技术主管克雷格・希尔瓦斯坦因说:“人们很有可能会盲目信任数字。”为了纠正可能的错误, Google和其他机构把数学家及其他学科的专家,包括社会科学专家放在同一个团队。
正如数学家需要全力对付人类的古怪行为和难解之谜一样,经理人员和企业家也必须温习一下数学方面的知识。中层管理者可以将大部分工作交给手下的工作人员去做。但是,他们仍然必须了解足够的数学知识,从而能够对数字背后的假设提出质疑。斯坦福大学商学院的金融学教授保罗・弗莱德勒:“现在很容易就可以用一大堆分析数据和图表把人搞懵。我们得教会企业中的人辨别出哪些是唬人的东西。”
当然,还要辨别哪些是机遇。随着世界信息日益进入数学领域,数字王国成为一个日益广大的汇集之地。它是一个渗透型实验室其中充满了让人惊叹的各种关联,它也是新行业的诞生之地。是的,现在是了解数学的最好时机。
作者: | 斯蒂芬・贝克(Stephen Baker) |
翻译: | 陈晓宇 |