论如何利用AI IDE更加优雅地辅助文字工作之“二十大报告中'坚持'一词双语语料的提取”
本文作者详细记录了从二十大报告中英双语材料中提取含“坚持”一词的语料的过程,在尝试了Word查找、AI直接处理全文等方法因无法批量提取或AI幻觉严重而失败后,作者转向结合AI IDE(Augment)与Python脚本的精细化操作。首先,借助Augment辅助编写Python正则脚本初步提取中文句料,随后利用Augment的超长上下文处理能力和编辑权限,智能匹配并补全了缺失的英文翻译。为确保AI处理的准确性,作者又编写了反查脚本将提取结果与原文比对,并人工核查了少量不匹配项(主要由AI引入的微小标记导致)。最后,在统计“坚持”的多种英文译法时,鉴于翻译的复杂性(如意译、省略),作者发现编程预设较多的AI IDE不适用,转而使用通用AI(谷歌AI Studio)以问答形式逐步识别和统计,最终目标是确保所有译法计数总和与“坚持”出现总次数一致,展现了如何通过AI辅助逐步优雅解决复杂文字处理问题。