Skip to content

Instantly share code, notes, and snippets.

@Lloyd-Pottiger
Last active October 22, 2022 15:08
Show Gist options
  • Save Lloyd-Pottiger/2f9bfabcfd0e86230251ebb54315cf3d to your computer and use it in GitHub Desktop.
Save Lloyd-Pottiger/2f9bfabcfd0e86230251ebb54315cf3d to your computer and use it in GitHub Desktop.
TiDB Hackathon 2022 RFC

【完整版本,可进入初赛评分】

Data Dance

  • Team name: 图一乐
  • Authors: 颜秋阳,邓水雄,Wish
  • Repo: Data Dance

项目介绍

Data Dance 是一个允许你探索、分析、理解数据的在线服务。通过 Data Dance 提供的交互式分析界面及强大的计算引擎,你不需要专业知识,就可以迅速地对千万乃至上亿的数据进行快速分析,从而发现新的见解、回答更多问题、做出更好决定。

背景 / 产品对比

  • OSS Insight 基于 GitHub 数据集、提供给了用户探索 GitHub 各项数据的能力,例如查看开源项目发展趋势等,但它只能分析 GitHub 数据集。另外它作为一个单方面向用户提供数据的 Web 1.0 服务,价值主要取决于 OSS Insight 维护者能提供怎样丰富的数据解读,而无法基于用户自己的需求和智慧产生不同的数据解读方式。
  • Google Doc、Notion 等在线协作表格服务允许用户分享自己的数据、并生成自己想要的图表,但它们主要侧重点都在于数据的协作编辑,能分析的数据规模有限,也不具备现成的公共数据集供用户探索。
  • Google Public Data 提供了丰富的公共数据集,并允许用户进行分析,但它提供的分析能力有限,只能进行简单的几个种类分析,也无法将分析的结果与其他人进行共享。
  • Observeable 允许用户对数据进行分析及可视化,并形成笔记进行分享,但用户需要精通 SQL 语句的编写才能对数据进行自由分析。
  • TiDB Cloud Playground 提供小规模 GitHub 数据集,并允许用户自行编辑 SQL 语句探索数据,但用户必须先注册 TiDB Cloud 并启动集群后才可以开始使用,也需要用户精通 SQL 语句的编写。另外,它不提供可视化能力,理解数据的难度较大。

Data Dance 则融合了它们的优点,提供以下功能:

  • 提供丰富的公共数据集,如来自权威数据源的实时人口数据、经济数据、教育数据、甚至是新冠感染数据、NFT 交易数据等。无需注册,即可对这些丰富的数据进行分析,更好地理解这个快速变化的世界。
  • 你无需是一个数据分析师:Data Dance 提供简单易用的 BI 分析界面,无需专业知识即可开始分析;同时也对资深用户提供直接编写 SQL 语句进行数据分析的能力。
  • 支持用户上传自己的数据集进行分析。
  • 具备强大的计算能力,快速分析从几千到上亿规模的数据,无需等待。
  • Data Dance 不是数据灵感的生产者,而是数据灵感的分享平台:用户可以将各个分析结果组合成交互式笔记,类似于 Jupyter Notebook,并组合分享给任何人。用户也可以对其他人的分析笔记进行复制(Fork)、编辑和二次分享,形成自己的数据解读。

案例演示

除了基本功能以外,我们将现场演示如何在 Data Dance 在线服务中,通过点击鼠标的方式,快速复刻出一个 OSS Insight 中的页面,为浏览者提供开源项目的趋势展示。这全程不需要用户自行准备任何数据、下载任何组件、注册任何服务,也不需要用户熟悉编程语言的开发。

项目设计

Data Dance 的前端使用 React + TailwindCSS 实现;

Data Dance 的后端由 TiDB + TiFlash 驱动,提供上亿实时数据的快速分析能力。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment