AI 声脉

面向未来的方言语音数据基础设施
让中国每一种声音,真正进入 AI 世界

项目简介

AI 声脉 是一个高性能的 方言语音数据采集与管理生态系统, 致力于解决语音识别(ASR)技术在方言与少数语言上的结构性缺失。

平台以 微信小程序 作为前端入口, 让母语使用者与社区志愿者可以安全、低门槛地贡献语音数据, 并通过 FastAPI + PostgreSQL 将声音转化为 AI-ready 的结构化数据资产

问题背景

  • ASR 模型长期高度依赖普通话语料
  • 中国数百种方言缺乏系统性数据采集
  • 语音数据碎片化、难以规模化复用
  • 缺乏语言与说话人维度的精细标注

AI 声脉的解决方案

AI 声脉采用 「社区化采集 × 工程化数据生产」模式, 构建标准化、可扩展、可持续的方言语音数据管道:

  1. 微信小程序完成低摩擦语音采集
  2. 统一设计日常与专业语音任务
  3. 安全上传与版本化存储
  4. 语音与语言、地域、人口统计信息精准绑定

核心能力

🎙 多方言语音采集

覆盖自然对话、情景表达与领域提示词, 为真实语音环境而设计。

🧬 精细化语言与说话人元数据

每条录音系统性关联语言类型、方言区域、 语义场景与人口统计信息。

⚙️ AI 级后端架构

FastAPI 高性能接口 + PostgreSQL 结构化存储, 直接服务 ASR 与语音大模型训练。

技术架构

  • 前端:微信小程序(跨平台、强分发)
  • 后端:FastAPI(高并发、低延迟)
  • 数据库:PostgreSQL(结构化语言资产)
  • 输出:AI-ready 方言语音数据集

价值与影响

  • 推动更公平、包容的语音 AI
  • 提升政务、医疗、公共服务的方言可达性
  • 支持语言研究与文化数字化保护
  • 成为本地化 ASR 的关键数据底座

我们的愿景

构建中国最系统、最真实、最可用的
方言语音数据基础设施,

让 AI 不只听得清普通话,
也听得懂每一种地方的声音。