https://gitee.com/alexgaoyh/pap-all-project 针对参加工作以来遇到的业务问题,搭建一套自认为较独立的业务模块,命名为PAP。 技术栈: 技术栈为 Spring Boot 2.x 配套 Spring Cloud、 My...
背景 近期再次遇到了关于知识库的需求,对照[langchain-ChatGLM 本地知识库],发现提取文本内容的功能在这个领域中必不可少,故对其进行了研究。 编码 使用Spring Maven 与 Apache T...
背景 最近和朋友聊天,突然聊到了视频编辑的换脸功能,对此功能进行了调研,通过分析,最终选择Paddle飞浆的PaddleGAN的 "First Order Motion" 进行视频换脸功能。 环境配置 废话不多说,直接...
动态规划-编辑距离-两字符串集合重排序 背景 近期遇到一个需求,想要对两个字符串集合进行重排序(对齐)操作,将两个字符串集合中尽可能相同的字符串存放到相同的位置上。 示例 假设...
介绍 近期在研究NLP相关技术,再次感受到中文领域分词算法的重要性,突然想到一年前在项目中使用到的Lucene技术中关于分词器的部分,对其再次进行对比分析,并混合多种现有分词方法,获得...
背景 本文是[Huggingface]系列文章的第一篇,期望通过如下的介绍,向用户展示[Huggingface]可以做到哪些事情。 环境安装 分为三个代码段落,首先使用conda初始化python环境,其次安装...
介绍 近期遇到了需要从电子文档中进行内容提取的任务,具体来说就是期望从PDF文件中进行表格抽取,本文主要介绍 tabula-java 和 paddlepaddle 的 pp-structure 两种方案。 思路 本文...
介绍 langchain-ChatGLM基于本地知识库的问答应用,建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。 背景 从2023年初,断断续续的在工作中试用了ChatGPT,...
介绍 ERNIE-UIE信息抽取模型可以进行关键信息抽取,可参照官网安装流程进行配置和使用。 但是在实际的细分领域中(细分的应用场景),信息抽取的效果并不好(中文书写习惯截然不同),本文按...
介绍 近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。 采用此方法,避免了很笨的 OCR + 正则匹配 的思路。 应用场景 电子...
Hibernate dynamic model 动态模型 介绍 Hibernate的动态模型为我们动态改动表结构带来了方便, 个人认为这一点非常有价值, 现在的企业级应用系统越来越强调用户可定制性, hibernate的这一...
介绍 软件行业从业者在日常工作过程中,经常会遇到请求转发的问题,本文介绍的 XSwitch 是一款应用于 Chrome 浏览器的请求转发插件。 对这款插件进行总结就是 : 将指定的特定 url ...
在数据检索的应用场景中,经常出现高级检索的功能需求,指定不同的字段与不同的逻辑关系,对数据进行检索。在某些应用场景中,会要求按照检索条件的顺序进行数据查找。 为解决按照检...
自定义相似度算法(只考虑词频/命中数) 在使用Elasticsearch的时候,针对排序结果,有些时候只关注对应的词出现的次数,相当于只考虑词频,这个时候就可以使用当前的插件。 当前插件继...
没有更多内容
加载失败,请刷新页面
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复