avatar
文章
124
标签
162
分类
34
首页
时间线
标签
分类
pdf笔记
休闲
  • 听音乐
  • 演唱会
友情链接
关于
desperado
搜索
首页
时间线
标签
分类
pdf笔记
休闲
  • 听音乐
  • 演唱会
友情链接
关于

desperado

正则表达式:参考 https://deerchao.cn/t…
发表于2021-02-16|更新于2026-04-07
正则表达式参考 https://deerchao.cn/tutorials/regex/regex.htm常用的操作使用re替换的函数123456789101112import reinputStr = 'hello 234 world 567 额外rwe2121'def _add111(matched): intStr = matched.group("number") intValue = int(intStr) addedValue = intValue + 111 addedValueStr = str(addedValue) return addedValueStrreplacedStr = re.sub("(?P<number>\d+)", _add111, inputStr);print(replacedStr) 123456789def replace(matched): group_str = matched.group("page"...
Scrapy中间件源码解读:源码解读
发表于2021-02-16|更新于2026-04-07
源码解读class MiddlewareManagerE:\python3.7.6\Lib\site-packages\scrapy\middleware.py class Spider(MiddlewareManager)E:\python3.7.6\Lib\site-packages\scrapy\core\spidermw.py class Download(MiddlewareManager)E:\python3.7.6\Lib\site-packages\scrapy\core\downloader\middleware.py class Extensions(MiddlewareManager)E:\python3.7.6\Lib\site-packages\scrapy\extension.py ItemPipelineManager(MiddlewareManager)E:\python3.7.6\Lib\site-packages\scrapy\pipelines_init_.py 关于中间件如何调用1234567891011121314151617181920...
Scrapy调试技巧:scrapy fetch
发表于2021-02-16|更新于2026-04-07|scrapy
scrapy fetch12scrapy fetch https://segmentfault.com/a/1190000017087999scrapy fetch https://segmentfault.com/a/1190000017087999 --nolog --headers scrapy shell 带请求头 1scrapy shell -s USER_AGENT="Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0" https://www.zhihu.com/question/285908404 1234$ scrapy shell>>> from scrapy import Request>>> req = Request('yoururl.com', headers={"header1":"value1"})>...
Scrapy的extensions:EXTENSIONS
发表于2021-02-16|更新于2026-04-07|scrapy
EXTENSIONSEXTENSIONS_BASE 注意:关于scrapy爬虫extensions 执行顺序的问题 查看默认的爬虫中间件scrapy settings –get EXTENSIONS_BASE 12345678910{"scrapy.extensions.corestats.CoreStats": 0,"scrapy.extensions.telnet.TelnetConsole": 0, "scrapy.extensions.memusage.MemoryUsage": 0, "scrapy.extensions.memdebug.MemoryDebugger": 0,"scrapy.extensions.closespider.CloseSpider": 0, "scrapy.extensions.feedexport.FeedExporter": 0, "scrapy.extensions.logstats.Log...
Scrapy的download中间件
发表于2021-02-16|更新于2026-04-07|scrapy
下载中间件DOWNLOADER_MIDDLEWARES 注意:关于scrapy下载中间件执行顺序的问题 scrapy本身有默认的一些中间件DOWNLOADER_MIDDLEWARES_BASE,可以通过scrapy settings –get DOWNLOADER_MIDDLEWARES_BASE命令查看 12345678910111213141516{"scrapy.downloadermiddlewares.robotstxt.RobotsTxtMiddleware": 100,"scrapy.downloadermiddlewares.httpauth.HttpAuthMiddleware": 300,"scrapy.downloadermiddlewares.downloadtimeout.DownloadTimeoutMiddleware": 350,"scrapy.downloadermiddlewares.defaultheaders.DefaultHeadersMiddlewar...
Scrapy的spider中间件:爬虫中间件
发表于2021-02-16|更新于2026-04-07|scrapy
爬虫中间件SPIDER_MIDDLEWARES 注意:关于scrapy爬虫中间件执行顺序的问题 查看默认的爬虫中间件scrapy settings –get SPIDER_MIDDLEWARES_BASE 1234567{ "scrapy.spidermiddlewares.httperror.HttpErrorMiddleware": 50, "scrapy.spidermiddlewares.offsite.OffsiteMiddleware": 500, "scrapy.spidermiddlewares.referer.RefererMiddleware": 700, "scrapy.spidermiddlewares.urllength.UrlLengthMiddleware": 800, "scrapy.spidermiddlewares.depth.DepthMiddleware": 900} SPIDER_MIDDLEWARES 设置...
mitmproxy / mitmdump
发表于2021-01-16|更新于2026-04-07
mitmdump文档https://docs.mitmproxy.org/stable/ 安装pip install mitmproxy mitmdump -q -s inect_js.py -p 9999 -q:屏蔽mitmdump默认的控制台日志,只显示自己脚本中的 -s:入口脚本文件 -p:更改端口,默认为8080 修改脚本文件时,不用重启也会生效 针对 HTTP 生命周期的事件 请求:def request(self, flow: mitmproxy.http.HTTPFlow): 响应:def response(self, flow: mitmproxy.http.HTTPFlow): 其它: def http_connect(self, flow: mitmproxy.http.HTTPFlow): def requestheaders(self, flow: mitmproxy.http.HTTPFlow): def responseheaders(self, flow: mitmproxy.http.HTTPFlow): def err...
git笔记:提交格式:
发表于2021-01-15|更新于2026-04-07|git
常用的git命令 git mv file_from file_to(重命名文件,删除原来的文件,添加新文件到暂存区) git switch 命令专门用于切换分支,可以用来替代 checkout 的部分用途。 git update-index –skip-worktree git branch -u origin/branch 建立当前分支与远程分支的映射关系 git update-index –assume-unchanged git log –all –since “2021-03-01” –oneline –author=”Zhang-Jane” git remote update origin —prune 更新远程分支本地列表 git branch -vv 查看分支映射 git push origin –delete 删除远程分支 git rev-list —all | xargs git grep -F 关键词 git ls-files 查看哪些文件在版本控制下 git clone -b 远程分支名 仓库地址 git blame 查找文件修改者...
Frida的hook脚本:Hook RegisterNatives
发表于2020-12-05|更新于2026-04-07|frida
Hook RegisterNatives命令frida -U --no-pause -f package_name -l xx.js 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109var ishook_libart = false;function hook_libart() { if (ishook_libart === true) { return; } var symbols = Module.enumerateSymbolsSync("libart.so"); var addrGetStringUTF...
Appium启动多个移动设备:元素的判断
发表于2020-11-22|更新于2026-04-07|自动化测试
元素的判断from selenium.webdriver.support import expected_conditions as EC expected_condtions提供了16种判断页面元素的方法: 1.title_is:判断当前页面的title是否完全等于预期字符串,返回布尔值 2.title_contains:判断当前页面的title是否包含预期字符串,返回布尔值 3.presence_of_element_located:判断某个元素是否被加到dom树下,不代表该元素一定可见 4.visibility_of_element_located:判断某个元素是否可见,可见代表元素非隐藏,并且元素的宽和高都不为0 5.visibility_of:跟上面的方法是一样的,只是上面需要传入locator,这个方法直接传定位到的element就好 6.presence_of_all_elements_located:判断是否至少一个元素存在于dom树中,举个例子,如果页面上有n个元素的class都是’coumn-md-3’,name只要有一个元素存在,这个方法就返回True 7....
1…8910…13
avatar
Jane
We think too much and feel too little. More than machinery we need humanity!
文章
124
标签
162
分类
34
Follow Me
公告
This is my Blog
最新文章
浏览器端大文件存储指南2026-04-07
从 Prompt 到 Harness Engineering:AI 代码开发的演进之路(2022–2026)2026-04-07
AI 爬虫:工具实战与能力边界(2026)2026-04-06
Kubernetes 学习笔记:架构、调度、资源与排错(2026 整理版)2026-04-06
文件格式知多少?——从日常开发到性能优化,全面解析文件格式的奥秘2026-04-06
分类
  • AI4
  • JavaScript1
  • Python4
  • Twisted4
  • andorid逆向6
  • django3
  • flask5
  • frida3
标签
asyncio 泳道图 InnoDB GitHub Copilot 竞品分析 AI 视频 Model Context Protocol Cursor scrapy的extensions OpenClaw 桑基图 ASGI Git Twisted 架构 Sora Yarn hexo 算法 Anthropic OpenAI 鱼骨图 Crawl4AI 燃尽图 python3 构建工具 Webpack 工程化 Nitro 项目管理 SEO Agent WBS IndexedDB Vite 后端 前端工程化 MFA 锁 linux命令
归档
  • 四月 2026 28
  • 三月 2023 2
  • 二月 2023 3
  • 一月 2023 2
  • 十二月 2022 20
  • 五月 2021 18
  • 四月 2021 7
  • 二月 2021 6
网站信息
文章数目 :
124
本站访客数 :
本站总浏览量 :
最后更新时间 :
© 2025 - 2026 By Jane框架 Hexo 8.1.1|主题 Butterfly 5.5.4
搜索
数据加载中