百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

wx搜一搜下拉关键词以及相关搜索词,ocr识别工具技术交流

yuyutoo 2025-01-02 20:10 1 浏览 0 评论

我是亓八九十!之前我发布过一款wx搜一搜下拉关键词的工具,这几天抽空优化了一下,优化了OCR识别的区域准确性,以及新增了对相关搜索词的识别和提取。

今天我在这和大家做一下技术交流,顺便讲下wx搜一搜下拉关键词和相关搜索词工具的开发和使用教程。

一、关键词OCR识别代码交流:

  1. 我使用的是python3.7,适合新手开发些小软件的工具。
  2. 使用百度OCR通用识别接口(每月有免费1000次调用额度)
  3. 开发思路:打开电脑搜一搜客户端,获取绑定窗口,定义起始关键词。使用代码控制自动输入,同时使用百度OCR截图区域识别文字,保存excel。

二、下拉关键词及相关搜索词工具功能概念介绍

1.下拉关键词。

概念如下图:当你输入搜索词后,会自动出现下拉关键词,我把这个叫下拉关键词。通过ocr对特定区域文字识别后,都保存到excel中。

2.相关搜索词。

概念如下图:当你输入搜索词,点了搜索之后,最右边出现的相关搜索,这里的词语叫相关搜索词,同理,使用ocr识别特定区域文字后保存excel。

三、关键词与相关搜索词工具操作教程

  1. 软件目录文件介绍

ocrkey.ini文件是填写百度ocr识别接口的key。

ip.txt这个文件不要动。

authcode.txt是填写授权码文件。

下拉搜索词提取exe是专门提取上述讲的下拉词的工具。

相关搜索词提取exe是专门提取上述讲的右边相关词的工具。

2.界面以及功能点解释

1)关于提取方式:

a.循环提取指输入一个根关键词,再设定要循环的行数。

b.循环提取行数设置1,意思是第一次提取的9个词为一行,然后会把这9个词都再按照根关键词循环一遍。

c.指定提取是指:先把要提取的不同根关键词放在txt文件里。

d.指定提取选择txt文件后,程序会按照txt每行的词去输入并提取一次相关的关键词。

2)保存路径就是你要保存的路径。

3.准备工作

创建百度应用并申请API Key访问百度开放平台:首先,访问百度开放平台官网并登录你的百度账号。

https://console.bce.baidu.com/

找到文件识别项目,创建应用。

创建应用:

在公有云服务页面,点击“创建应用”按钮。填写应用名称、应用类型、应用描述等信息,并选择你需要使用的OCR功能(如通用文字识别等)。

申请API Key:创建应用成功后,你将获得一个唯一的API Key。这个Key将用于后续调用OCR接口时进行身份验证。请妥善保管你的API Key,不要泄露给他人。

可领取免费资源,每月1000次的免费额度,够我们一般人使用了。基本就是免费了。

4.使用操作

  1. 打开软件目录ocrkey.ini文件,自行填写上述百度ocr的key。
  2. 打开authcode.txt文件填写授权码
  3. 根据需要双击你需要使用的程序
  4. 打开电脑版微信,点击打开搜一搜主页面,先随便填一个词点击搜索到最终页面,切记这时候关闭微信,不是退出,是关闭最小化到桌面右下角!注意啊,不是点击最小化,是点击×关闭。只留搜一搜的页面。

5.软件选择循环提取还是指定提取,选择循环提取,就在软件界面输入根关键词,和循环行数(默认1,一般设置1结果会有90个关键词)。选择指定提取需要选择txt文件,就是你把不同的根关键词放在txt文件里,一行一个。

6.点击提取关键词按钮。中途不要动鼠标和键盘,直到程序结束。最好的操作就是只留搜一搜窗口和程序窗口进行操作。

好了,以上就是我使用python和百度ocr识别技术做的工具,在这里和大家做下交流。关注我,后续会继续推出实用工具技术交流。

相关推荐

如何在EXCEL中进行IP地址排序

Excel中排序IP地址是非常不友好的,它完全是通过首位进行排序,无法实现我们的实际效果。作为IT人员对于IP地址的真正诉求是想要从小到大排列。那么如何进行排序呢?在Excel中,我们可以使用如下函数...

Excel揭秘!Left函数开启高效字符串左端截取模式

今日推荐:LEFT函数。目的:把一组身份证号码或者一组电话号码的敏感信息隐藏起来。...

五十一、UiPath字符串函数的介绍和使用(转)

一、字符串属性Length:是指字符串长度如:intlen=字符串变量.Length;Chars:是指字符串转换成字符数组,数组从0开始,通常配合Length属性使用如:System.Charc=...

打工人一定要会的Excel的15个技巧!

今天给各位打工人分享15个Excel常用的小技巧,废话不多说,直接开始!先给大家看一张快捷键速查表:1.Ctrl+C和Ctrl+V只是入门你可能已经很熟悉基本的复制粘贴,但如果你想让粘贴操作更高...

go语言中字符串常用的系统函数

最近由于工作比较忙,视频有段时间没有更新了,在这里跟大家说声抱歉了,我尽快抽些时间整理下视频今天就发一篇关于go语言的基础知识吧!我这我工作中用到的一些常用函数,汇总出来分享给大家,希望对...

最全的 ES 重点内容整理(上)

●我们从很多年前就知道ES6,也就是官方发布的ES2015●从2015年开始,官方觉得大家命名太乱了,所以决定以年份命名●但是大家还是习惯了叫做ES6,不过这不重要●重要的是...

2024 最火的5个顶级白板应用,燃爆了!

大家好,很高兴又见面了,我是"...

Excel Trim函数用法的6个实例,Excel 顽固空格的去除方法

在Excel中,Trim函数用于去文本的前后空格和字符之间的空格,但在去字符之间的空格时,它不会把所有空格都去除,而是留下一个空格;如果要把字符之间的所有空格都去掉,需要用Substitute函数...

TS类型体操,看懂你就能玩转TS了

本文以Typescript4.5及以上版本为基础,于2022年02月07日在掘金首发本文要实现一种类型工具...

一种接地气的编码规则:废弃驼峰式命名,告别手敲基础代码。

一种好的编码规则,能提高工作效率。在软件编程领域内,“驼峰”式命名规则是首选方式,最早来源于Perl语言编程的畅销书《programPerl》(oRelly出版)的封面图片正是一匹骆驼,故而得名。...

AI 应用开发最常用的解释型Python语言如何保护源代码

众所周知,解释型语言Python/JavaScript/Perl/Shell是在无需编译,可以直接运行,因此很难保护源代码,例如C、C++、JAVA属于编译型语言,运行之前需要先编译才能运行...

2020年树莓派的5种最佳编程语言

树莓派是最灵活的电脑之一。也许不是在硬件上,但是它的可操作性使它成为一个独立的类。树莓派跨越了电脑和编程之间的鸿沟,让每个人都能接触到电脑。因此,各个年龄段的编程爱好者都掀起了一股编程热潮。它允许他们...

5 种即将消亡的编程语言

每个编写代码的人都有自己喜欢的语言...

[240610] 5 种 Non-Posix Shell 在 x-cmd 上的支持 | Perl 发布 5.40.0

5种非PosixSHell-nushell,fish,xonsh,csh,pwsh利用三天假期,我开始动手增加了对各种Non-Posixshell的x-cmd支持。在这个过程中,...

Linux批量修改文件名及强大的$\「\」用法介绍

一:Rename命令rename命令用字符串替换的方式批量改变文件名。rename命令有两个版本,一个是c语言版本的,一个是perl语言版本的,判断方法:vim`whichrename`C语言版本...

取消回复欢迎 发表评论: