wx搜一搜下拉关键词以及相关搜索词,ocr识别工具技术交流
yuyutoo 2025-01-02 20:10 1 浏览 0 评论
我是亓八九十!之前我发布过一款wx搜一搜下拉关键词的工具,这几天抽空优化了一下,优化了OCR识别的区域准确性,以及新增了对相关搜索词的识别和提取。
今天我在这和大家做一下技术交流,顺便讲下wx搜一搜下拉关键词和相关搜索词工具的开发和使用教程。
一、关键词OCR识别代码交流:
- 我使用的是python3.7,适合新手开发些小软件的工具。
- 使用百度OCR通用识别接口(每月有免费1000次调用额度)
- 开发思路:打开电脑搜一搜客户端,获取绑定窗口,定义起始关键词。使用代码控制自动输入,同时使用百度OCR截图区域识别文字,保存excel。
二、下拉关键词及相关搜索词工具功能概念介绍
1.下拉关键词。
概念如下图:当你输入搜索词后,会自动出现下拉关键词,我把这个叫下拉关键词。通过ocr对特定区域文字识别后,都保存到excel中。
2.相关搜索词。
概念如下图:当你输入搜索词,点了搜索之后,最右边出现的相关搜索,这里的词语叫相关搜索词,同理,使用ocr识别特定区域文字后保存excel。
三、关键词与相关搜索词工具操作教程
- 软件目录文件介绍
ocrkey.ini文件是填写百度ocr识别接口的key。
ip.txt这个文件不要动。
authcode.txt是填写授权码文件。
下拉搜索词提取exe是专门提取上述讲的下拉词的工具。
相关搜索词提取exe是专门提取上述讲的右边相关词的工具。
2.界面以及功能点解释
1)关于提取方式:
a.循环提取指输入一个根关键词,再设定要循环的行数。
b.循环提取行数设置1,意思是第一次提取的9个词为一行,然后会把这9个词都再按照根关键词循环一遍。
c.指定提取是指:先把要提取的不同根关键词放在txt文件里。
d.指定提取选择txt文件后,程序会按照txt每行的词去输入并提取一次相关的关键词。
2)保存路径就是你要保存的路径。
3.准备工作
创建百度应用并申请API Key访问百度开放平台:首先,访问百度开放平台官网并登录你的百度账号。
https://console.bce.baidu.com/
找到文件识别项目,创建应用。
创建应用:
在公有云服务页面,点击“创建应用”按钮。填写应用名称、应用类型、应用描述等信息,并选择你需要使用的OCR功能(如通用文字识别等)。
申请API Key:创建应用成功后,你将获得一个唯一的API Key。这个Key将用于后续调用OCR接口时进行身份验证。请妥善保管你的API Key,不要泄露给他人。
可领取免费资源,每月1000次的免费额度,够我们一般人使用了。基本就是免费了。
4.使用操作
- 打开软件目录ocrkey.ini文件,自行填写上述百度ocr的key。
- 打开authcode.txt文件填写授权码
- 根据需要双击你需要使用的程序
- 打开电脑版微信,点击打开搜一搜主页面,先随便填一个词点击搜索到最终页面,切记这时候关闭微信,不是退出,是关闭最小化到桌面右下角!注意啊,不是点击最小化,是点击×关闭。只留搜一搜的页面。
5.软件选择循环提取还是指定提取,选择循环提取,就在软件界面输入根关键词,和循环行数(默认1,一般设置1结果会有90个关键词)。选择指定提取需要选择txt文件,就是你把不同的根关键词放在txt文件里,一行一个。
6.点击提取关键词按钮。中途不要动鼠标和键盘,直到程序结束。最好的操作就是只留搜一搜窗口和程序窗口进行操作。
好了,以上就是我使用python和百度ocr识别技术做的工具,在这里和大家做下交流。关注我,后续会继续推出实用工具技术交流。
相关推荐
- 如何在EXCEL中进行IP地址排序
-
Excel中排序IP地址是非常不友好的,它完全是通过首位进行排序,无法实现我们的实际效果。作为IT人员对于IP地址的真正诉求是想要从小到大排列。那么如何进行排序呢?在Excel中,我们可以使用如下函数...
- Excel揭秘!Left函数开启高效字符串左端截取模式
-
今日推荐:LEFT函数。目的:把一组身份证号码或者一组电话号码的敏感信息隐藏起来。...
- 五十一、UiPath字符串函数的介绍和使用(转)
-
一、字符串属性Length:是指字符串长度如:intlen=字符串变量.Length;Chars:是指字符串转换成字符数组,数组从0开始,通常配合Length属性使用如:System.Charc=...
- 打工人一定要会的Excel的15个技巧!
-
今天给各位打工人分享15个Excel常用的小技巧,废话不多说,直接开始!先给大家看一张快捷键速查表:1.Ctrl+C和Ctrl+V只是入门你可能已经很熟悉基本的复制粘贴,但如果你想让粘贴操作更高...
- go语言中字符串常用的系统函数
-
最近由于工作比较忙,视频有段时间没有更新了,在这里跟大家说声抱歉了,我尽快抽些时间整理下视频今天就发一篇关于go语言的基础知识吧!我这我工作中用到的一些常用函数,汇总出来分享给大家,希望对...
- 最全的 ES 重点内容整理(上)
-
●我们从很多年前就知道ES6,也就是官方发布的ES2015●从2015年开始,官方觉得大家命名太乱了,所以决定以年份命名●但是大家还是习惯了叫做ES6,不过这不重要●重要的是...
- 2024 最火的5个顶级白板应用,燃爆了!
-
大家好,很高兴又见面了,我是"...
- Excel Trim函数用法的6个实例,Excel 顽固空格的去除方法
-
在Excel中,Trim函数用于去文本的前后空格和字符之间的空格,但在去字符之间的空格时,它不会把所有空格都去除,而是留下一个空格;如果要把字符之间的所有空格都去掉,需要用Substitute函数...
- TS类型体操,看懂你就能玩转TS了
-
本文以Typescript4.5及以上版本为基础,于2022年02月07日在掘金首发本文要实现一种类型工具...
- 一种接地气的编码规则:废弃驼峰式命名,告别手敲基础代码。
-
一种好的编码规则,能提高工作效率。在软件编程领域内,“驼峰”式命名规则是首选方式,最早来源于Perl语言编程的畅销书《programPerl》(oRelly出版)的封面图片正是一匹骆驼,故而得名。...
- AI 应用开发最常用的解释型Python语言如何保护源代码
-
众所周知,解释型语言Python/JavaScript/Perl/Shell是在无需编译,可以直接运行,因此很难保护源代码,例如C、C++、JAVA属于编译型语言,运行之前需要先编译才能运行...
- 2020年树莓派的5种最佳编程语言
-
树莓派是最灵活的电脑之一。也许不是在硬件上,但是它的可操作性使它成为一个独立的类。树莓派跨越了电脑和编程之间的鸿沟,让每个人都能接触到电脑。因此,各个年龄段的编程爱好者都掀起了一股编程热潮。它允许他们...
- 5 种即将消亡的编程语言
-
每个编写代码的人都有自己喜欢的语言...
- [240610] 5 种 Non-Posix Shell 在 x-cmd 上的支持 | Perl 发布 5.40.0
-
5种非PosixSHell-nushell,fish,xonsh,csh,pwsh利用三天假期,我开始动手增加了对各种Non-Posixshell的x-cmd支持。在这个过程中,...
- Linux批量修改文件名及强大的$\「\」用法介绍
-
一:Rename命令rename命令用字符串替换的方式批量改变文件名。rename命令有两个版本,一个是c语言版本的,一个是perl语言版本的,判断方法:vim`whichrename`C语言版本...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)