目 录
对 AI 编程和脚本的“祛魅”
从脚本机能反推律师工作中值得自动化的五大场景公约数
-批量信息提取
-批量文本处理
-批量文件操作
-批量数据分析
-跨系统自动化
脚本的特殊价值:只在本地操作,对数据安全的绝对保护
律师如何与 AI 协作高效手搓脚本
如何发现自己工作中的“DeepSeek机会”
我刚到星瀚不多久,就听说了一个技术神话:刑事部的邵洋律师,在复旦读书的时候又学法、又学计算机,专长于计算机相关案件。还长期“利用职务之便”,为律所的业务及管理做各类自动化脚本的开发和工具搭建。他有一个专栏,叫 PythonX 律师工作效率。
这个专栏的第一篇文章,名为《律师如何利用简易编程避免重复劳作》,内容大意是,邵洋律师向我们展示如何用 Python+Selenium 写出可以自动批量下载上海市监局的企业登记档案的脚本。前几年,每次想沉下心好好拜读、学习,都被瘆人的名词劝退:怎么定位网页元素的XPath路径,怎么抓包分析PDF下载地址的结构,怎么拿OpenCV的模板匹配算滑块验证码的拖动距离,怎么配ChromeDriver的版本,怎么处理Cookie维持登录态......
这类纯干货的文章,不完整实操下来,是万万读不懂的。当然,现在我也读不懂。不过,站在2026年年中的时间点,我大可断言:我不需要懂,AI 懂就可以了。
我把这篇文章链接,扔给了 Kimi Code(模型用的是 Kimi K2.6,目前国内我认为最佳的编程模型之一,有视觉能力,有足够的调用敏锐度),请他仅根据文章内容,生成脚本:
结论是:时代真的变了。一方面,写脚本不再费时费力,同样的需求放六年前,可能需要一个既懂 Python 又懂法律业务的律师手搓至少一个周末,现在从需求提出到效果验证,只需要1杯咖啡的时间;另一方面,就像图中的「重要提醒」说的那样,目标网站本身的结构、反爬机制等势必有迭代。所以,大家不必再向邵律师讨这个脚本的下载链接了,自己和 AI 根据实际情况协作产出就好。
我们在5分钟说清 OpenClaw 对律师意味着什么,以及律师真的需要“养龙虾”吗?
一文中曾经说到过,很多律师在工作中的幸福时刻,来源于那些一闪而过的提效念头,有机会被快速验证。彼时,已经介绍了:批量修改证据材料文件名、本地知识库的应用与转化等场景的可能性和实现过程。
今天,我们聚焦到可能是编程项目的最大公约数——脚本(script)的制作和应用上,从工具形态反推场景,以及介绍为什么我们觉得脚本一定程度上可以实现既符合法律行业对数据安全、信息安全的追求,又可以实现提效的目标。不求穷尽一切可能,但求有些启发。也“请专业人士轻拍,希望能与爱好科技的斜杠法律人多多交流。”
先强调一下,AI 编程、脚本,不是什么玄乎的概念。
简单说,就是你用自然语言告诉AI你想做什么,它帮你写代码、调试、运行、交付项目(图片、文本、APP、网页、脚本等等)。你不需要会Python,不需要懂JavaScript,不需要配置开发环境,更不需要处理什么依赖冲突。你只要会说人话就可以。市面上已经有不少成熟的工具:Cursor、Codex、Claude Code、Kimi Code......它们的本质都是一样的。
而“脚本”的内容,最基础的形态就是:先打开这个文件夹,然后对每个文件做某件事,做完之后把结果存到那里。电脑照做,不知疲倦,不会出错,不会喊累。
对律师来说,脚本最吸引人的地方有两点:一是极度贴合个性化的工作流,二是可以纯本地运行。尤其是第二点。律师每天接触的文件——客户合同、银行流水、卷宗扫描件、微信聊天记录——几乎件件涉密。把它们上传到某个第三方平台处理,哪怕对方承诺保密,心里总不踏实。一个纯本地、无任何网络请求的脚本,文件从头到尾只在你的电脑上流转,这在客户信息保护上,是一道物理级别的防线。
脚本的基础能力,无外乎读取文件、处理内容、输出结果。但如果把它放到律师的日常工作中,可以推导出至少五类高频场景:批量信息提取、批量文本处理、批量文件操作、批量数据分析和执行批量动作。
图片 1 银行流水批量提取脚本示意图
类型一:批量信息提取——从混沌中抓出结构
律师日常打交道的许多材料,本身是“非结构化”的。从文件形式上看,PDF扫描件、图片、网页截图、聊天记录,都不是纯粹的文本和表格。同时,也会因为材料供给方的工作习惯,而存在多层文件夹嵌套、命名无序等干扰项,以及,大量与关键信息无关的噪声。
「典型场景」
企业内档批量提取:从工商档案里提取股东信息、变更记录、章程条款等
合同关键条款提取:从几十份合同里批量抓取付款条件、违约条款、管辖约定等
卷宗信息提取:从法院提供的数百个卷宗里,批量提取原告、被告、案由、判决结果、涉案金额等
简历/名片信息提取:批量读取候选人简历,提取姓名、院校、工作年限、联系方式等
脚本在其中发挥的价值,就是把原来由具体的人来逐份摘录替换成由机器批量转化。更关键的是,整个过程可以在纯本地完成——PDF 读入本地、本地处理、Excel/Word/Markdown 等形式输出到本地,没有任何数据流出你的电脑。
类型二:批量文本处理——格式化、清洗、转换
法律文本是非常注重规范的,格式不统一、编号混乱、空格和换行随心所欲的文本,都会被视作不专业,无论是客户、还是法官、对手律师,都会因此而否定你的价值。
「典型场景」
证据材料批量重命名:IMG_20240101_001.jpg → 2024-01-01_合同签署页_原告
法律条文格式统一:把从不同来源复制的法条,统一成团队规定的引用格式、字体、行间距
聊天记录清洗:把微信导出的混乱 TXT,按时间线整理、去重、标注对话人
多文件合并/拆分:把分散的 20 份 DOCX 按章节合并,或把一份 500 页的标书按招标文件要求拆成独立文件
几百上千个文件,手动改名字可能要半天,脚本跑一遍不超过5分钟,大量机械劳动、蚕食灵魂的工作任务可以被释放,让各级律师专注于更体现职业价值的判断上。
图片 2 在脚本里,大量内容其实与说明书无异
类型三:批量文件操作——搬运、归档、分发
文件管理是一门体力活,也是技术活,无论是在知识管理的过程、案件材料整理的时候,都会遇到散落各处的情况,在下载文件夹、在微信接收文件夹、在邮件附件、在扫描仪输出目录等等......
「典型场景」
邮件附件批量下载+分类:按标题的编号、发件人、日期自动归档
跨平台文件同步:把各类社交、工作平台里收到的文件,按项目自动汇总
定期清理与备份:自动删除超过半年的临时文件,或按规则打包备份到指定目录
你可以设计一个常用的文件整理习惯:比如,每7天的文件打包成一个文件夹;同一个发件人的打包;同格式的打包.......这类脚本执行成功后,就可以让文件自己找到该去的位置。
类型四:批量数据分析——从数字里找线索
无论是诉讼业务,还是非诉业务都少不了和数据打交道:银行流水、交易记录、财务报表、票据清单。
「典型场景」
银行流水交易对手分析:从成百上千行的表格中,提取特定对手的往来记录,按转入/转出分类统计,或针对某一周期的异常高频转账进行归纳
时间线自动梳理:从多个来源(邮件、聊天记录、合同签署日期)提取时间戳,生成事件时间线
发票批量整理:按月份、项目、金额区间自动分类,生成报销汇总表
人眼扫几万行数据容易疲劳,分析成果的质量会伴随时间长度的增长而下降,但机器不会。换句话说,你正在打碎excel类表格文件本身的技术屏障,让数据自己跑起来,把你要的结果带给你。
类型五:跨系统自动化——拒绝无谓地点击鼠标
这是最接近六年前那篇文章的场景:有些系统有数据,但没有批量导出功能,你只能一份份手动操作。
「典型场景」
工商档案批量下载:自动登录、查询、下载、重命名、归档(六年前那篇文章的核心场景)
法院系统批量查询:按案号列表自动查询案件进度,抓取结果汇总
网页信息批量采集:从裁判文书网、企查查等公开平台,按关键词批量抓取结构化信息
目前,也有类似 Kimi WebBridge 的网页自动化代理工具可以直接使用,结果大同小异,但脚本本身没有产品壁垒,可延展性更强。
效率和安全,有时候是相对的。对律师行业而言,数据隐私保护极其重要,甚至可以放弃效率,既因为律师对客户的保密义务是职业伦理的底线,也因为律师的知识和经验是立身之本。
在实际工作中,尤其是了解到那么多 AI 提效的方法和工具,我们一定会反复面对这个矛盾心理:我想用AI提效,但我的文件,不能也不该上传到第三方。即使平台承诺“我们保证安全”,但律师们对客户文件、身份信息、商业秘密......依然是不放心的。所以,纯本地脚本的价值就在这里:它不需要你上传任何东西。
从技术的角度看,脚本处理文件的完整链路是这样的:
文件从磁盘加载到内存,由脚本程序在本地运算处理,处理结果直接写回磁盘。整个过程中,脚本不会发起任何网络请求,不会建立对外 TCP 连接,文件内容不会以任何形式传输到外部服务器。你的客户合同、卷宗扫描件、银行流水数据——从打开到保存,全程停留在你的设备内部,物理层面没有离开过你的电脑。
当然,不是所有脚本都一定不会涉及到网络请求,但在上述五类场景占比重绝对是少数。同理,也不是说所有工作场景下,以往的通用 AI 工具都不能用了,而是说,对于涉密程度最高的工作环节,本地脚本提供了一种"零信任外部平台"的解决方案。 你甚至可以断网运行它,它依然正常工作。
对律师而言,这就是一种可控的安全感。
让我们回到2020年,看看邵洋律师是怎么实现工商档案批量下载的。
他要解决的核心痛点很具体:上海市场监管局的企业档案网上查询系统,每次查一家企业要手动登录、逐份下载,文件名全是默认的 downloadPdf.pdf。复杂案件里几十上百家企业,纯手动操作是体力灾难。
于是他决定写脚本。整个链条大概是这样的:
模拟登录目标网站 → 解析网页源代码的结构 → 批量下载文件并整理
而浸润全文的,是在教学读者怎么装 Python、怎么装第三方库、怎么下载对应版本的 ChromeDriver、怎么禁止 Chrome 自动更新。
所以,原来的编程项目,难点不完全在于“思路有多难”,而是对一个没有编程功底的人来说,实现链条实在太长了。你要懂 Python 语法、懂浏览器原理、懂图像处理、懂网络抓包,还要会配环境、会调版本、会处理各种异常。它确实在要求你同时是律师和程序员,即成为邵洋律师一样的超级个体。六年前,这是少数“有计算机功底”的律师才能享有的效率特权。今天,同样的需求,说“说人话”就可以获得了。
让我们用同样的需求——工商档案批量下载——看看 AI 编程时代的做法。
你跟 AI 说:“帮我写一个脚本,自动登录上海市企业登记档案网上查询系统,破解滑块验证码,根据企业名称批量下载 PDF 档案,并按文件夹结构重命名整理。”
AI 会自己完成:选什么技术方案(Selenium + OpenCV 还是其他)、写每一行代码、处理环境依赖、调试运行时错误。甚至帮你发现网站更新了、下载路径变了,并且自动完善好了代码。
最本质的变化是:
2020 年的模式:发现痛点 → 判断没有现成工具 → 学编程 → 查文档 → 写代码 → 调试 → 配环境 → 终于跑通 → 使用
2026 年的模式:发现痛点 → 用自然语言描述需求 → AI 生成脚本 → 运行和迭代
律师的核心动作,从“写代码”变成了“描述问题”和“判断方案是否靠谱”。
这意味着,那些曾经因为"不会编程"而搁置的提效想法——批量改文件名、自动整理发票、定时导出群成员列表——现在都可以被快速验证。而且,如前面所说,这些脚本可以设计成纯本地运行,数据不出你的电脑。
聊到这里,相信大家可能已经有点感觉了。但怎么在的日常工作中,识别出“这件事可以用脚本自动化”呢?
三个判断标准:
第一,高频。 这件事你一周要做一次以上,或者一次要做很多份。
第二,重复。 每次操作的步骤几乎一样,没有本质变化。
第三,有规则。 即使步骤复杂,只要规则明确("如果文件名包含A就移到B文件夹"),脚本就能处理。
满足这三个条件,就值得考虑自动化。
具体怎么做?我们觉得,大概有这么三步要走:
发现:记录你一天中“机械劳动”的时间占比。改文件名、整理文件夹、复制粘贴数据、反复登录同一个系统下载东西——这些就是最值钱的东西。
描述:把“人怎么做”用自然语言说清楚。不需要技术术语,就像教实习生一样描述步骤。
验证:把描述丢给 AI,让它生成脚本。在本地跑一遍,看结果对不对。不对就继续用语言调整。
回到开头那篇2020年的文章。邵洋律师在文章里说到:“作为面向搜索引擎编程的爱好者......”,这可能是那个时代自学成才的程序员最真实的写照。
邵律师花了大量业余时间查资料、试代码、调环境,才跑通一个功能。但他做到了,而且把自己的经验分享出来,让更多同事们看到了可能性。即使,那套代码大概率已经因为网站改版而失效了,且现在有了更好的 AI 编程工具可以不需要事事都麻烦他本人上场。但他向我们证明了:律师完全可以主动拥抱技术,用工具来解决自己的痛点。
这个精神,在今天依然珍贵,在未来或许已成必备。