意大利大数据应用领先实践
一、数据分析领域
案例1:感测人类行为,预测能源消费
应用领域:能源消费预测模型
项目负责人:Andrey Bogomolov
项目简介:项目致力于优化意大利Trentino省电力能源生产-输配-销售链。对于电力生产和输配商而言,本项目通过限制电力能源生产以减少电力消费,通过销售终端计划以减少电力输配成本;同时,本项目为电力波峰预测提供了借鉴。
本项目主要解决两个问题:(1)日均电力需求预测。通过意大利Trentino省电网系统,该预测利用人类行为数据——移动通信数据,优化了电力能源生产-输配链,减少了气候变化的影响。(2)电力波峰预测。
本项目模型建立了高阶希尔伯特空间数学模型,利用了Trentino省移动网络数据,预测了各电网未来一周内的日均电力需求和电力波峰。Leo Breiman随机预测算法解决了本项目模型的非线性回归问题。同时,本项目模型拥有较少的状态空间维度,从而能够有效地应用于大数据分析。
案例2 利用大数据规划米兰
应用领域:城市规划与监测
项目负责人:David Meyer
项目简介:项目为米兰人口、环境及其交互作用提供了动态理解。利用米兰地区的电信网络数据,项目建立了人口预测模型,辨识了非常规移民人口,并揭示了米兰的潜在社会结构。同时,项目利用交通和气象数据预测了城市空气质量。
案例3 熵——评价常住居民/移民信息,提升生活品质
应用领域:社会学分析
项目负责人:Michele Tizzoni
项目简介:项目的主要创新在于对“熵”函数的定义。高熵值单元代表异质性高的区域,对应于旅游热点或闹市区;低熵值单元代表以国际电话业务为标准的 高特征区域。电话通信数据可以被有效利用以监测大范围事件,项目利用“熵”函数得到了传统分析得不到的信息。一方面,某一时间节点代表高度不确定性的高熵 值揭示了该区域非常规/例外事件的发生;另一方面,针对高度活跃的国际通话业务,项目通过拓扑学分析了该城市国际社区的空间特征。
案例4:基于兴趣目标导向的广告宣传
应用领域:广告
项目负责人:Aris Anagnostopoulos
项目简介:相较于线上广告,线下广告面临着达不到满意宣传目标的问题。基于社交网络信息和人口数据,项目对Tweeter文本内容进行了语义分类,区分了不 同Tweeter用户对电影、音乐、体育等领域的感兴趣程度;利用Tweeter位置的地理标记功能,预测了用户分布和网络传播趋势。
以某领域的广告投放为例。首先,线下广告分类投放不同Tweeter用户。选择的广告投放用户应对该广告感兴趣,应能使总体效益最大化。其次,线下广告投放至 该领域有影响力的Tweeter用户。投放的广告不仅是为了覆盖该领域更多的用户,更是为了使该领域有影响力的用户获知并传播该广告,从而使该广告达到事 半功倍的效果。
案例5:个性化的导航系统应用
应用领域:移动导航
项目负责人:Antonio Lima
项目简介:项目为城市交通提供了新的导航系统,有效平衡了个人偏好和公众兴趣。使用者可以利用智能设备个性化的定制城市导航路线,如选择最短路径,避免犯罪 区域、污染区域、交通拥堵区域,或者避免日程计划事件区域等。当地政府也可以针对社区做出限制性规定,如减少学校地区的噪音污染。本项目以城市历史和实时 数据为基础,以使用者个人偏好和政府限制规定为依据,向使用者反馈路线信息。
案例6:基于Twitter展现的城市社交网络幸福度分析
应用领域:社会学分析
项目负责人:Iyad Rahwan
项目简介:心理幸福度对社会生产、社会创新和违法犯罪均会产生影响,公共社交媒体为衡量区域幸福度提供了参考。项目以Twitter内容为基础进行了幸福度 分类,研究了米兰市中心不同区域社交联系和幸福度之间的关系,制作了米兰市幸福度空间分布图。项目研究表明,不幸福区域比幸福区域吸引了更高的通信交流。 该研究有助于了解社会结构和城市心理幸福度之间的关系,有助于创新机制以提升城市心理幸福度。
二、数据可视化
案例7:米兰城市空气污染的可视化
应用领域:空气污染监测
项目负责人:Yhidad Calle
项目简介:人类是强烈的视觉动物,因此可视化数据是要传达给他人的最快方法。动态、交互式的可视化有助于人们探索数据。本项目运用了交互式和动态图形,简化了数据读取,方便了对此领域不熟悉的公众。
可视化的例子。2013年12月,米兰的几个主要污染物的强度分布图——热图,其中包含在矩阵中的数值被表示为颜色数据的图形;径向堆叠面积图以24小时为一圈进行编码,分析了每小时各污染物的累计浓度。
案例8:空中鸟瞰下的人类行为
应用领域:叙事
项目负责人:Gergely Daroczi
项目简介:小数据或大数据的难点不是数据量的大小以及如何处理数据,焦点在于“如何把数据转化为有用的信息”?本项目运用了多种可视化技术,提供了空中鸟瞰下的人类活动。
移动汽车的分布、拨出电话的地理分布、二氧化氮排放及空气污染、交通事故的位置分布,这些都反映了人类活动。本项目演示文稿旨在反映人类的日常活动。
三、应用
案例9:基于Twitter语言的旅游分析
应用领域:旅游
项目负责人:Salih Ergut
项目简介:对于游客来说,寻找当地热门的旅游目的地不是一件简单的事情。旅游指南、博客、旅游网站等提供了该城市的一些信息,但却很难从这些冗长的信息中发现有用的价值。
游客在旅行时很难在地图上找到想去的地方。已有的旅游信息更多的是通用的,并没有反映不同文化的特点。本项目考虑了游客的背景,开发了相应的应用程序,达到了使旅行有趣的目的。
案例10:城市用地使用情况分析
应用领域:城市规划
项目负责人:Irene Celino
项目简介:城市规划的目的是通过土地使用信息规划城市环境。然而,收集土地信息并予以分类的成本代价较高。人们在生活环境中会留下痕迹,是否可以将这些痕迹数据化并予以监测,从而有效地预测“生活”土地使用情况?
本项目研究致力于:(1)通过大数据分析得到2013年城市用地使用“足迹”;(2)将这些“足迹”与2009年的城市用地使用情况比较;(3)分析2009年-2013年的土地用途偏差。
本项目对认识和监测土地使用情况的变化产生积极的影响。如,为城市规划提供支持,减少土地普查费用等。