Skip to content

Instantly share code, notes, and snippets.

@airawat
airawat / 00-MapSideJoinDistCacheTextFile
Last active July 28, 2024 12:44
Map-side join example - Java code for joining two datasets - one large (tsv format), and one with lookup data (text), made available through DistributedCache
This gist demonstrates how to do a map-side join, loading one small dataset from DistributedCache into a HashMap
in memory, and joining with a larger dataset.
Includes:
---------
1. Input data and script download
2. Dataset structure review
3. Expected results
4. Mapper code
5. Driver code
@zhangyoufu
zhangyoufu / 北京医保定点医院.csv
Created February 15, 2019 07:52
北京医保定点医院
编码 医院名称 所属区县 医院类别 医院等级 医保分类
13162002 北京市顺义区城区社区卫生服务中心绿港家园社区卫生服务站 顺义区 社区卫生站 未评级
13162003 北京市顺义区城区社区卫生服务中心石园社区卫生服务站 顺义区 社区卫生站 未评级
13162004 北京市顺义区城区社区卫生服务中心滨河社区卫生服务站 顺义区 社区卫生站 未评级
13162005 北京市顺义区城区社区卫生服务中心西辛南区社区卫生服务站 顺义区 社区卫生站 未评级
13162006 北京市顺义区城区社区卫生服务中心五里仓社区卫生服务站 顺义区 社区卫生站 未评级
13162007 北京市顺义区城区社区卫生服务中心裕龙社区卫生服务站 顺义区 社区卫生站 未评级
13162008 北京市顺义区城区社区卫生服务中心建新北区社区卫生服务站 顺义区 社区卫生站 未评级
13162009 北京市顺义区城区社区卫生服务中心幸福西区社区卫生服务站 顺义区 社区卫生站 未评级
13162010 北京市顺义区城区社区卫生服务中心东兴社区卫生服务站 顺义区 社区卫生站 未评级