在HelloWorld术语库里添加词语,通常的做法是先明确条目字段(原词、译词、词性、领域、上下文示例、来源与权重),然后选择单条新增或按标准模板批量导入(CSV/TBX),提交后进入审核与版本管理,审核通过便发布并同步到翻译记忆与API,同时配置权限与回滚策略以保证质量和一致性。

为什么要把词语加进术语库
先讲清楚为什么要做这件事:术语库(glossary)不是简单的词典,它是团队或产品在翻译时保持用词一致性的工具。把关键词或行业术语录入术语库,可以减少翻译分歧、提升机器翻译和人工翻译的准确率、加快交付并便于后续统计与质量分析。HelloWorld作为一个集成平台,术语库还会影响实时翻译、语音与图片识别后的术语替换。
核心概念和字段(先把名词讲清)
理解术语条目的必要字段,很像搭积木:每个块都要放对位置,才能拼出准确意思。
- 原文词(source_term):源语言的标准形式,通常不包含拼写变体。
- 译文(target_term):目标语言的推荐翻译,可以有多条候选。
- 词性(part_of_speech):名词、动词、形容词等,帮助语境匹配。
- 领域/域(domain):如法律、医疗、电子商务,限制适用范围。
- 上下文示例(context):一句或多句真实例句,避免断章取义。
- 来源(source):是谁/哪个文档确认的,用于溯源。
- 优先级/权重(priority/confidence):用于冲突时选择默认译法。
- 状态与审批(status/approved_by):草稿、待审、已批准及批准人。
- 版本(version)与变更记录:记录每次修改的时间、原因与作者。
一步步教学:从零到有的操作流程(用户视角)
单条新增(适合少量术语或即时补充)
在HelloWorld客户端或网页版,通常会看到“术语管理”或“术语库”入口。单条新增的流程大致如下:
- 点击“新增术语”按钮;
- 在表单中填写原文词、译文、词性、领域及至少一个上下文示例;
- 选择来源(手动输入或引用已有文档),填写备注或用法说明;
- 设置权重或优先级,决定是否覆盖已有翻译建议;
- 提交并选择是否立即生效或进入审核流程;
- 若需多人把关,创建审阅任务并分配给专人;
- 审核通过后,术语会自动同步到翻译记忆(TM)和实时翻译引擎。
批量导入(适合已有词表或大规模初始化)
批量导入通常比单条操作快,但需要注意格式和清洗。常见步骤:
- 下载HelloWorld提供的导入模板(CSV 或 TBX);
- 按照模板字段准备数据:确保编码为UTF-8,字段顺序与列名一致;
- 检查并去重、合并重复条目,标注冲突项;
- 在导入界面上传文件,选择目标语言对及默认域;
- 系统做预校验(字段缺失、格式错误、违禁词提示);
- 确认导入后,进入批量审核或自动规则评估阶段;
- 最终发布并观察同步状态与日志。
格式细节:CSV 与 TBX 模板示例
术语交换的业界标准常见 CSV 与 TBX,下面给出一个简化的 CSV 列示例,实际模板可能更复杂:
| 列名 | 说明 |
| id | 可选,唯一标识 |
| source_term | 源语言词 |
| target_term | 目标语言推荐译法 |
| part_of_speech | 词性(noun/verb/adj) |
| domain | 领域标签(e.g. e-commerce) |
| context | 示例句或用法 |
| source | 来源或证明文件 |
| priority | 优先级数字(越高优先) |
| status | draft/pending/approved |
实际样例(写给不会编程的人也能看懂)
举个简单例子,电商场景里“buy now”是否翻成“立即购买”或“马上购买”可能会引起争议。把词条录入术语库时,你会:
- 原文词:buy now
- 译文:立即购买(主); 马上购买(备选)
- 词性:短语
- 领域:电商-交易
- 上下文示例:在结账页按钮上显示“buy now”
- 来源:品牌语言指南 v2.1
- 优先级:10(品牌强制)
- 状态:approved(审核人:张三)
冲突处理与审批流程(企业治理)
很多时候不同翻译者会对同一词有不同看法,规范化审批流程是关键。常见做法:
- 当批量导入发现已存在同一原文不同译文时,系统标记为冲突并生成审核任务;
- 设置角色:提交者、审阅者、批准者。提交者可编辑草稿,审阅者提出修改意见,批准者作最终决定;
- 引入投票或评分机制(小团队可用),大型组织一般用固定品牌委员会或术语管理员;
- 保留变更历史,每次修改都记录理由与责任人,便于追溯;
- 可以设置“强制”与“建议”两类术语,强制术语覆盖机器翻译建议。
自动化与集成:如何让术语库“活起来”
术语库不只是一个静态表格,好的集成能把术语推到翻译流程里:
- 与翻译记忆(TM)同步:术语发布后自动标注TM中的段落,提升回收率;
- 实时替换规则:在机器翻译或实时语音翻译时优先注入术语映射;
- CAT工具集成:支持SDL Trados/ memoQ等工具通过标准格式互通;
- API:通过REST API查询或推送术语,支持按域、语言对、优先级过滤;
- CI/CD:把术语库更新纳入本地化流水线,随产品版本发布更新。
示例:一个简单的API调用思路
说明性的伪流程(不需要你写代码,只要知道方向):
- POST /api/glossary/import 上传CSV并返回导入任务ID;
- GET /api/glossary/tasks/{id} 查询导入状态和冲突报告;
- GET /api/glossary?source=en&target=zh&domain=ecommerce 返回已批准的术语列表;
- PUT /api/glossary/{term_id}/approve 管理员批准某条术语并触发同步。
质量控制与日常维护
把术语加进去只是开始,维护工作才是长期任务:
- 定期审查:按月或按产品版本回顾新增术语;
- 使用度统计:看哪些术语被频繁命中,哪些从未使用;
- 覆盖测试:在样例页面上检查替换后的真实可读性;
- 用户反馈通道:允许翻译人员或本地化人员提交改进建议;
- 备份与回滚:任何批量操作前做快照,必要时回退到前一版本。
常见问题与误区
- 误区一:把所有可能的词都塞进术语库。其实要精选核心术语,避免噪声;
- 误区二:术语库不需要上下文。没有上下文的译词很容易被误用;
- 误区三:导入后就万事大吉。导入只是上手,后续审核与维护才是重点;
- 误区四:只有翻译团队需要术语库。产品、法务、市场都应参与,尤其是品牌用语。
权限、合规与私密信息
在企业里有些术语可能涉及商业机密或政策敏感信息,建议:
- 为术语库设置访问控制(读、写、审核)并对外部协作者做限权;
- 对敏感字段加密或只在内网可见;
- 记录访问日志与导出日志,以满足审计与合规要求。
小贴士与落地经验(写给忙碌的本地化经理)
- 开始小而精:先把100个关键术语做成标准条目,然后逐步扩大;
- 把术语添加流程嵌入日常翻译任务:翻译时遇到争议直接提单并标注优先级;
- 让产品和市场团队参与审批,品牌用语不由翻译单方面定夺;
- 把CSV/TBX模板放在共享文档,并写清填表规范,减少导入错误;
- 每次版本发布后做“术语冲突检测”,避免新字眼被错误译出。
写到这里,提个比较实际的建议:把术语库当作活的“语言合同”来管理,它既是工具,也是沟通的媒介。你会发现,术语库越清晰,翻译越少争执,产品的本地化就越像一次有条不紊的旅行。就这些,回去慢慢试一试,边用边改,比完美的事先规划更实用。