跳转至

My Digital Worker : Work with AI

导言

26年开年,Agent爆火,我也尝试了OpenClaw、CC等前沿工具和API接口。当前问题还是记忆力不够(即使1M也远远不够),这导致你还是不能将其看作是一个“数字员工”。从技术发展、幻觉和使用成本角度考虑,AI仍然将作为单点技术咨询/单问题解决( 定制prompt )的角色参与到个人的工作中,来增强个人能力,促成“生产力”超高的超级个体的产生。

大部分员工只是按部就班的做事,但是AI时代下,什么有价值,应该做什么(应该要AI帮你做什么)反而是最重要的。

本文将从SE角度:热点跟踪、技术调研、客户交流/筛选规划、按期执行、测试看护、总结汇报。 这些方面来介绍我是怎么利用AI辅助加速的。

热点跟踪

交付件

  1. 领域内的重磅模型、开源工作跟踪
    1. 微信公众号、
    2. github、
    3. arxiv
    4. O-DataMap
  2. AI辅助开发技术跟踪
  3. 日常数据跟踪文档

加速方案

OpenClaw或者其他定时任务。

多模态RL仓跟踪 prompt
跟踪下面Github仓库的PR合入,总结成markdown报告发送给我,**报告要求**: 阅读每条PR内容,总结技术思路,不只是标题,全部输出中文翻译和总结。

总结时深入思考:关注多模态RL领域内最新变化;(出了什么新东西,对华为昇腾NPU/Ascend的启示)2. 思考昇腾的当前的能力和发展方向;(当前能力,后续规划)

- VeRL (verl-project/verl) - 需持续关注已合入PR
- VllmOmni (vllm-project/vllm-omni) - 需持续关注已合入PR
- Slime (THUDM/slime) - 智谱RL,需持续关注已合入PR
- VeRL-Recipe (verl-project/verl-recipe) - 需关注已合入PR + Open PR
- VeOmni (ByteDance-Seed/VeOmni) - 字节Omni,需持续关注已合入PR
- DiffSynth-Studio (modelscope/DiffSynth-Studio) - 魔搭DiffSynth,需持续关注已合入PR
- DiffusionNFT (NVlabs/DiffusionNFT) - NVIDIA Diffusion,监控每个commit(不活跃仓库)
- SteptronOss (stepfun-ai/SteptronOss) - StepFun训练框架,监控每个commit(不活跃仓库)
- MobileAgent (X-PLUG/MobileAgent) - 阿里GUI Agent,监控PR(含UI-S1 RL训练框架)
- ROLL (alibaba/ROLL) - 阿里大模型RL训练框架,监控已合入PR

微信公众号很难爬取

技术调研

交付件

  1. 针对热点,调研/明确相关知识(技术的来龙去脉
    1. 背景(缘起、热门契机);
    2. 核心技术、重点工作及其技术解释;
    3. 当前主航道、衍生流派;
    4. 开源Github工作
    5. 未来技术发展方向;
    6. 对公司的启示。
  2. 输出调研文档和PPT,用于内部分享和技术交流。

加速方案

围绕NotebookLM的调研产出(不充会员,每天次数有限)

借助LLM,拓展并明确拓展范围 prompt

中转站都没有思考能力,建议网页版,或者OpenRouter。

从资深的华为软件架构师,专注于多模态和强化学习领域的视角出发。

你需要收集信息、全面收集 “xxx” 方向的知识点(来龙去脉):

尤其是

1. 背景(缘起、热门契机);
2. 核心技术、重点工作及其技术解释;
3. 当前主航道、衍生流派;
4. 开源Github工作
4. 未来技术发展方向;
5. 对公司的启示: 出了什么新东西,对华为昇腾NPU/Ascend的启示;思考昇腾的当前的能力点和发展方向;(当前能力,后续规划)。

整理出需要关注的具体知识点和具体方向,供notebooklm后续深入收集。

评论