在文本信息提取的领域,正则表达式长期以来都是精准匹配结构化数据的强大工具,而LLM(大语言模型)的崛起为非结构化文本解析带来了更灵活的可能性。本文将围绕正则匹配与 LLM 提取展开探讨,并结合Prompt 调用的细节,分析不同模型在文本解析中的表现。 任务描述 从自然语言中提取时间与提醒事项 [2025-10-05 11:25 周日] 三天后早上8点通知我检查邮件 ---> {"time": "2025-10-08 08:00", "Remind": "检查邮件"} [2025-08-30 09:30 周六] 周一上午10点叫我去银行 ---> {"time":...
...
一、查找元素 1. 基本查找 .find(name, attrs, recursive, text) 查找第一个符合条件的标签。 参数: name: 标签名(字符串、列表或正则表达式)。 attrs: 属性字典。 recursive: 是否递归查找,默认为 True。 text: 标签内的文字内容。 示例:soup.find('a', {'class': 'link'}) **.find_all(name, attrs, recursive, text)...
经过几天的熬夜加班,工作总算告一段落了,现在等着出运行结果,摸鱼到处搞点东西,然后对Linux的个人用户目录再做了一次调整 ~ 新添加了 Scripts Logs Docs,然后对Data 与 Models 结构进行一次调整 目录说明 🔧 Code 快速测试代码/一些库的demo ⚙️ Configs 各种配置文件 📚 Data 存放数据,使用时 link 到项目目录或直接指向这里 `...
这团队每次更新都有些小bug,之后到 huggingface 上看这个问题也修复了。 ChatGLM4Tokenizer._pad() got an unexpected keyword argument 'padding_side' glm常有的问题了,从glm2开始,每次都会在 model、tokenization 文件出现小bug. 定位到models目录下的相关文件 ( 不是 .cache 中的,会被覆盖 ),此处出问题的是 tokenization_chatglm.py, 直接在出问题的地方添加个参数。 def _pad( ...
需要从目录A的n个数据库合并,合并时字段重复报错。而且这个问题在设置小进程的时候没有出现,设置更多进程就发生了 ... 首先想到是不是给的数据中有重复,但理论上是不可能的。不管怎么样也先打印结果看看。发现文件重复了。 然后看看MPI分配有没有写错 size = comm.Get_size() data = os.listdir(args.inputs) input_file = [Path(args.inputs) / f for f in data if f[-4:]=='gpkg'] n_files = len(input_file) files...
起因:某个程序年前在登录节点测试通过后就放假没搞了,假期后重新开搞,把脚本什么的都整好,打算一键启动然后摸鱼,突然弹出报错信息,然后开始了漫长的debug... run task ImportError: libarchive.so.13: cannot open shared object file: No such file or directory 首先 ldd查看问题 ldd local/gdal/lib/libgdal.so 没有发现问题... 之后思考,猜测是在运算节点的问题,修改sbatch脚本输出 $PATH `...
> 网站收录 https://www.llamafactory.cn/ [图解KV缓存](https://zhuanlan.zhihu.com/p/662498827) [top_p、top_k、temperature](https://zhuanlan.zhihu.com/p/670562318)
对于一个大模型上线会进行 训练 -> 部署上线 -> 用户反馈 -> 微调训练 的循环, Ollama 便是简化了 部署上线 __ 这个流程。内置模型管理与__API支持。 Ollama安装部署与基本配置 (ollama提供 docker 快速部署) window 安装 在官网下载安装程序,直接双击安装即可;如需指定安装位置,需要在cmd中运行安装程序 OllamaSetup.exe /DIR=E:\MySoftware\Ollama 使用和关闭 ollama没有可视化操作界面,进程会在后台持续运行(相当于执...
pyhton的高级用法之一,能动态扩展或修改函数行为 基础用法 构造 def funcA(func): def sub(*arg): ''' 添加功能 ''' return func(*arg) #如果被修饰函数有返回值 再该函数内返回 return sub #返回该函数 使用 funcB=funcA(funcB) @funcA def funcB(): ... 带参数 funcB = funcA(...