Name: 讯飞听见
Author: 讯飞听见

技术架构

自主可控 · 技术领先

讯飞听见采用全自研技术栈，从底层算法到工程实现，每一行代码都凝聚研发团队的心血。

端到端语音识别

基于Transformer架构的端到端语音识别模型，从声学特征到文字输出全流程一体化处理，相较传统HMM模型准确率提升15%以上。

神经机器翻译

自研NMT神经机器翻译引擎，结合语境理解与行业语料训练，翻译结果自然流畅，专业领域BLEU值领先业界平均水平20%。

语音合成技术

支持30余种音色定制，情感TTS技术让合成语音更具表现力，适用于有声书制作、新闻播报、智能客服等场景。

声纹识别

毫秒级声纹特征提取与匹配能力，精准区分不同发言人角色，支持跨音频片段的说话人聚类，准确率达95%以上。

大模型增强

融合讯飞星火大模型能力，实现会议内容智能摘要、关键议题提取、自动问答等高级功能，让转写从"记录"升级为"理解"。

云边端协同

云端提供完整AI能力，边缘计算保障低延迟响应，端侧实现本地降噪与预处理，三层架构协同提供最佳性能与隐私平衡。

常见问题

您想了解的问题

以下是用户最常咨询的几个问题，希望能解答您的疑惑。

讯飞听见支持哪些设备平台？四端数据如何实现实时同步？

讯飞听见实现全平台无缝覆盖，四大平台同步支持：Windows端（Windows 7/8/10/11，32位与64位均支持）、macOS端（10.14及以上，完美适配Intel与Apple Silicon双芯片）、iOS端（iOS 12及以上，iPhone与iPad通用）、Android端（Android 7.0及以上，兼容手机与平板）。所有平台使用同一个讯飞账号登录，云端数据实时同步机制如下：转写记录、会议纪要、自定义词库、设置偏好（包括语言模式、快捷键配置、导出格式默认选项等）在任一设备操作后3秒内自动同步至其他设备；同一账号最多可在5台设备上同时登录，超出限制后最早登录的设备会被自动登出以保护账号安全。在电脑端录制的会议，回到办公室打开手机即可继续编辑；通勤路上在手机上录制的访谈，到办公室无缝切换至电脑端处理，真正实现"随时随地，转写不停"的移动办公体验。

转写速度有多快？影响转写时长的核心因素有哪些？

讯飞听见在转写速度上处于业界顶尖水平。实时转写延迟（从说话到文字显示）控制在500-800毫秒，基本实现话音落、文字出的流畅体验。音频文件转写速度通常为音频时长的1/4至1/3，例如：30分钟录音约8-10分钟完成，1小时录音约15-20分钟完成，4小时录音（最大支持长度）约60-80分钟完成。影响转写速度的核心因素包括：①音频质量——噪音低、音质好的音频处理更快；②说话人数量——3人以上会议需额外进行声纹分离处理，时间增加约20%-30%；③是否启用说话人分离、智能分段、关键词高亮等高级功能——每开启一项增加约5%-10%处理时间；④服务器负载——高峰期（工作日上午9-11点、下午2-4点）可能略慢；⑤套餐级别——企业版用户享有专属高速通道，同等条件下速度约为普通用户的2倍。批量任务支持后台排队处理，不影响前台正常使用。

专业版如何购买？支付方式、续费规则与退款保障是什么？

专业版购买路径：打开讯飞听见客户端→点击右上角头像→个人中心→套餐购买→选择"专业版 299元/年"→完成支付。支付方式覆盖主流渠道：微信支付（扫码支付，约3秒到账）、支付宝（扫码或刷脸，约3秒到账）、银行卡支付（需开通网银，约1-3分钟到账）、企业网银转账（对公付款，付款后需联系客服确认到账，约1-2个工作日）。续费规则：可设置自动续费（享95折优惠），到期前7天自动扣款；也可手动在账号中心操作，续费时若原套餐未到期则自动叠加剩余时长，不会清零作废。退款政策：首次购买专业版享有7天无理由全额退款保障（登录账号中心→申请退款→3个工作日内原路退回）；已使用时长超过免费版额度或超过7天则不支持退款，可联系客服协商特殊情况。团队批量采购（3席起）请联系商务获取专属折扣码，享受团队价。

企业版支持私有化部署吗？部署周期、硬件要求与成本估算？

企业版完整支持私有化部署，满足高数据安全合规要求。私有化部署方案包含以下核心组件：本地化语音识别引擎（离线运行，无需外网）、知识管理系统（含用户管理、权限控制、审计日志）、开放API网关（RESTful接口，支持与企业OA/IM系统对接）、管理控制台（可视化运营监控面板）。硬件推荐配置：标准规模（50人以下并发100路）——CPU 32核 Intel Xeon Gold或同级、内存128GB DDR4、SSD 1TB；中型规模（200人以下并发300路）——建议采用双机热备架构，每台配置CPU 64核、内存256GB；大型规模（500人以上）——建议采用Kubernetes容器化部署，支持弹性扩容。软件部署周期：标准方案约2-3周（含安装部署、数据迁移、培训）；定制化方案约4-12周（含需求分析、定制开发、UAT验收）。支持国产化适配：芯片层支持鲲鹏920、海光D2000、飞腾S2500；操作系统支持统信UOS、银河麒麟、华为欧拉。年度运维费用约为首次部署费用的15%-20%。

如何申请发票？发票类型、开票内容与审核时效说明

发票申请须在订单支付成功后30天内提出，逾期原则上不再受理。申请路径：登录讯飞听见官网→右上角头像→个人中心→订单管理→找到对应订单→点击"申请发票"→填写完整开票信息。必填信息包括：发票抬头（企业全称或个人姓名）、纳税人识别号（企业必填，个人无需填写）、注册地址与电话（开具专票时必填）、开户行与账号（开具专票时必填）。发票类型与差异：电子普通发票（推荐，免快递3日到邮箱，抬头可为个人或企业）；纸质普通发票（快递寄出约5-7日）；纸质专用发票（须具备一般纳税人资格，快递寄出约5-7日）。开票内容统一为"*信息技术服务*软件服务费"，税率6%（小规模纳税人）或13%（一般纳税人）。审核时效：电子发票提交后1-3个工作日内开具并发至邮箱；纸质发票提交后3-5个工作日内开具并寄出。企业客户可申请按月或按季度集中开票，减少财务工作量；大客户还可签订框架协议预存款，由财务定期根据消费金额开具。

试用期结束后数据会被清空吗？免费版与付费版数据是否互通？

试用期结束后数据绝对不会被清空，这是我们对用户的核心承诺之一。试用期内的所有转写记录、历史文档、自定义词库、导出文件、协作空间等数据将永久保存在您的账号中，不受套餐状态影响。试用期结束时账号自动降级为免费版，降级后影响仅限新建任务的额度限制（每月60分钟实时转写），历史数据仍可正常查看、编辑、导出和分享，不受任何影响。建议用户在试用期结束前，将重要项目的转写结果导出本地备份（以防万一），同时评估是否需要升级专业版或企业版以获取更多额度。付费版与免费版数据完全互通，不存在数据隔离：升级专业版后，免费版时期的历史记录、词库等均可无缝衔接使用；同理，降级回免费版后，付费功能（如多语言翻译、字幕导出）将被限制，但历史数据不受影响。

团队协作版支持多少人同时编辑？协作功能有哪些权限层级？

讯飞听见协作空间支持实时多人在线协同编辑，专业版单文档最多20人同时在线，企业版可扩展至100人并发协作。协作功能体系完整，包含以下核心能力：实时协同编辑——所有协作者可同时在同一个转写文档中编辑，系统通过CRDT算法（无冲突复制数据类型）确保多人同时编辑不产生数据冲突，变更实时合并；权限层级体系——文档创建者默认为"管理员"角色，可设置三类权限：查看者（仅可阅读，不能修改）、评论者（可添加行级评论与标注，但不能直接编辑文字）、编辑者（可完全编辑，管理员可修改权限）；协作工具——行级评论（选中任意文字添加评论，@成员提醒）、任务指派（将重点段落标记为"待办任务"并指派给团队成员）、@提及（在评论中@成员即时通知）、版本历史（回溯至任意历史版本，对比变更内容）；操作审计——所有编辑操作、评论、权限变更均有完整日志留存，便于团队管理与合规审计。协作空间支持生成公开链接或邀请特定成员，满足对外分享与对内协作的双重需求。

讯飞听见
官网下载
AI语音记录助手

强大功能 · 全方位覆盖

实时语音转写

音频文件转写

多语言翻译

智能字幕生成

多人协同编辑

云端同步备份

多元场景 · 精准匹配

企业商务会议

法律司法取证

视频内容创作

灵活方案 · 按需选择

自主可控 · 技术领先

端到端语音识别

神经机器翻译

语音合成技术

声纹识别

大模型增强

云边端协同

您想了解的问题

开始使用讯飞听见

Windows 版

macOS 版

移动端 App

讯飞听见官网下载AI语音记录助手

强大功能 · 全方位覆盖

实时语音转写

音频文件转写

多语言翻译

智能字幕生成

多人协同编辑

云端同步备份

多元场景 · 精准匹配

企业商务会议

法律司法取证

视频内容创作

灵活方案 · 按需选择

自主可控 · 技术领先

端到端语音识别

神经机器翻译

语音合成技术

声纹识别

大模型增强

云边端协同

您想了解的问题

开始使用讯飞听见

Windows 版

macOS 版

移动端 App

讯飞听见
官网下载
AI语音记录助手