基于大数据的房屋价值排序和商业选址模型

 

 

决定房屋价值的重要因素,第一是地段,第二是地段,第三还是地段。地段可以具体量化为周边的配套设施(道路结构、地铁、公交车站、商场和学校等)、人气(有多少人来,怎么来,如通过地铁、公交和出租车来的人数以及人们对这些地方的评价)和整个社区的品质。集合多源数据来做一个房屋价值的排序,可以帮助我们选择高价值的房子。这个模型也可以变成通用的商业选择模型,不仅仅局限于房地产行业的选址。请参看相关论文:

论文:

[1] Yanjie Fu, Hui Xiong, Yong Ge, Zijun Yao, Yu Zheng. Exploiting Geographic Dependencies for Real Estate Appraisal: A Mutual Perspective of Ranking and Clustering. In the Proceeding of the 20th SIGKDD conference on Knowledge Discovery and Data Mining (KDD 2014).

[2] Yanjie Fu, Yong Ge, Yu Zheng, Zijun Yao, Yanchi Liu, Hui Xiong, Nicholas Jing Yuan. Sparse Real Estate Ranking with Online User Reviews and Offline Moving Behaviors. IEEE International Conference on Data Mining (ICDM 2014).

 

 

 

基于大数据的城市物流优化

 

 

项目简介:城市中人们对收发快递的需求与日俱增,快递发送量往往超过快递员的实际运力。本项目根据快递发送者的请求位置和时间以及快递员的当前位置和后继行程,动态调度和规划快递员的快件收发路线,在不增加快递员人数的情况下大大提高整个物流系统物件的吞吐量。该项目涉及到时空数据的管理和动态查询技术,可满足大规模城市物流的需求。

论文:

[1] Siyuan Zhang, Lu Qin, Yu Zheng, and Hong Cheng. Effective and Efficient: Large-scale Dynamic City Express. IEEE Transactions on Data Engineering (TKDE)

 

 

 

基于车辆轨迹的广告牌选址

 

项目简介:根据大规模的车辆GPS轨迹信息选取k个路口放置广告牌,使得在一段时间内这些广告牌加到一起覆盖的独立车辆数目最大,从而最大化广告效益。该项目提供提供一个交互式的高效、可视分析工具,通过跟广告选址从业者不断的交互来,将行业知识反馈给算法,从而优化最终的选址结果。这是一个把人加在数据挖掘过程中(human-in-the-loop)的一个方法。由于有交互的需求,挖掘的过程必须非常高效。

 

 

论文:

[a] Dongyu Liu, Di Weng, Yuhong Li, Jie Bao, Yu Zheng, Huaming Qu, Yingcai Wu, “SmartAdP: Visual Analytics of Large-scale Taxi Trajectories for Selecting Billboard Locations”, in The IEEE Conference on Visual Analytics Science and Technology (IEEE VAST 2016).

Video Demonstration

 

 

 

基于稀疏社交媒体的最佳路线轨迹

 

 

项目简介: 一个用户的签到或者带有地标的照片数据都可被看成是不确定的轨迹,因为用户不会不停的签到或拍照。给出这样一条轨迹数据时,我们无法判断出该用户选择的具体线路(如图下左1子图)。但是,当我们把很多个用户的不确定线路叠加到一起的时候,就能猜测出最有可能的线路(如左2图所示),即“不确定+不确定=确定”。这样的应用可以帮助人们规划旅行线路。比如,一个用户想在一条线路中去后海、天坛和颐和园三个地方,他便可以把这三个点输入到系统里,我们便可根据大众的签到数据计算出一条最热门的游玩路线。

论文:

[1] Ling-Yin Wei, Yu Zheng, Wen-Chih Peng, Constructing Popular Routes from Uncertain Trajectories. 18th SIGKDD conference on Knowledge Discovery and Data Mining (KDD 2012). (Data)

[2] Hechen Liu, Ling-Yin We, Yu Zheng, Markus Schneider, Wen-Chih Peng. Route Discovery from Mining Uncertain Trajectories. Demo Paper, in IEEE International Conference on Data Mining (ICDM 2011).

 

 

 

从人们的轨迹数据中发现最有趣地点和线路

 

项目简介:从用户大量的GPS轨迹信息中发掘城市里有趣的地点和旅行线路。该信息对旅行规划和线路推荐有着重要的价值。有趣的地点并不完全由到访的人数来决定,否则机场和火车站将会变成最有趣的地方。这些人的经验值将起到区分地点有趣程度的作用。有经验的人更加能找到高品质的餐馆和景点;反过来,有趣的地点也能吸引有经验的游客。所以,人的经验值和景点的兴趣都有一个相互依存的迭代关系。

 

 

 

论文