作者归档:xing

传统数据治理为何不足?   传统强调标准化、集中管控;AI需要标注质量追踪、数据漂移监控、特征血缘回溯、差分隐私。需新建“AI数据湖”保留原始日志与中间特征。 高效标注流程?   主动学习:模型预测低置信度样本送人工标注,其余自动采纳。抽检10%计算Kappa一致性(>0.8)。每月执行偏见审…

继续阅读

除准确率外哪些指标关键?   P99延迟(实时场景<500ms)、鲁棒性(噪声下性能衰减<10%)、校准性(置信度与正确率匹配)、可重复性(温度=0时输出一致)。综合评分需加权。 如何设计对比测试?    抽取1000条真实业务数据+200条边界案例,盲审按“正确/部分/错误/有害”四级…

继续阅读

AI成本的隐性部分有哪些? 数据清洗与标注(占预算30%~50%)、模型调优与版本迭代、推理GPU闲置成本、人工复核输出、合规审计与日志存储。忽略这些会导致TCO低估40%以上。 如何优化推理成本? 采用模型路由:简单任务用小模型(如1B参数),复杂任务用大模型;缓存重复请求;使用INT4量化或批处…

继续阅读

20/21