Search Results - RepositoryStats

1.5k

7.9k

gpl-3.0

178

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰，旨在安全快捷的帮助用户拿回自己的数据，工具代码开源，流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开...

csdn crawl chrome spider hotmail outlook python3 tkinter selenium wxpython automation

Created 2020-07-11

245 commits to master branch, last one 4 months ago

novel-plus 201206030

1.3k

3.8k

apache-2.0

56

novel-plus 是一个多端（PC、WAP）阅读、功能完善的小说 CMS 系统。包括小说推荐、小说检索、小说排行、小说阅读、小说书架、小说评论、小说爬虫、会员中心、作家专区、充值订阅、新闻发布等功能。

book read crawl novel spider

Created 2020-05-02

468 commits to develop_xxy branch, last one about a month ago

Python3-Spider wkunzhi

1.0k

3.1k

unknown

95

Python爬虫实战 - 模拟登陆各大网站包含但不限于：滑块验证、拼多多、美团、百度、bilibili、大众点评、淘宝，如果喜欢请start ❤️

geek crawl python scrapy spider splash taobao crawler meituan dianping selenium pyppeteer scrapy-crawler

Created 2019-03-27

220 commits to master branch, last one 4 years ago

x-crawl coder-hxl

95

1.6k

mit

12

Flexible Node.js AI-assisted crawler library

ai crawl nodejs spider crawler ai-crawl chromium flexible puppeteer javascript typescript fingerprint multifunction

Created 2023-01-22

492 commits to main branch, last one 3 days ago

grab-site ArchiveTeam

137

1.4k

other

42

The archivist's web crawler: WARC output, dashboard for all crawls, dynamic ignore patterns

warc crawl spider crawler archiving

Created 2015-02-05

1,172 commits to master branch, last one 5 months ago

weixin-game-helper zhuweiyou

382

1.4k

gpl-3.0

77

微信小游戏辅助合集（加减大师、包你懂我、大家来找茬腾讯版、头脑王者、好友画我、悦动音符、我最在行、星途WeGoing、猜画小歌、知乎答题王、腾讯中国象棋、跳一跳、题多多黄金版）

game crawl robot helper nodejs python socket weixin charles fiddler mongodb anyproxy

This repository has been archived (exclude archived)

Created 2018-01-01

150 commits to master branch, last one about a year ago

xhs ReaJason

334

1.2k

mit

16

基于小红书 Web 端进行的请求封装。https://reajason.github.io/xhs/

xhs crawl python

Created 2023-04-03

183 commits to master branch, last one 7 days ago

sperm darbra

322

1.2k

gpl-3.0

30

浏览过的精彩逆向文章汇总，值得一看

crawl frida spider unidbg crawler

Created 2022-03-02

94 commits to main branch, last one 16 days ago

Crack-JS-Spider LoseNine

250

879

unknown

26

JS破解逆向，破解JS反爬虫加密参数，已破解极验滑块w（2022.2.19），QQ音乐sign（2022.2.13），拼多多anti_content，boss直聘zp_token，知乎x-zse-96，酷狗kg_mid/dfid，唯品会mars_cid，中国裁判文书网（2020-06-30更新），淘宝密码，天安保险登录，b站登录，房天下登录，WPS登录，微博登录，有道翻译，网易登录，微信公众号登录...

js crack crawl spider

Created 2020-02-09

35 commits to master branch, last one 7 months ago

stweet markowanga

67

593

mit

14

Advanced python library to scrap Twitter (tweets, users) from unofficial API

api user crawl scrap tweet twint users python scrape search tweets scraper twitter scrapper unofficial scrap-tweet twitter-api searchrunner

Created 2020-11-16

274 commits to master branch, last one about a year ago

clipper.js philschmid

34

495

apache-2.0

4

HTML to Markdown converter and crawler.

nlp crawl search markdown html-to-markdown retrieval-augmented-generation

Created 2023-09-27

24 commits to main branch, last one 11 months ago

nudecrawler yaroslaff

23

295

unknown

7

Crawl telegra.ph searching for nudes!

Created 2023-02-01

96 commits to master branch, last one 5 months ago

Pinkerton oppsec

46

283

mit

5

🕵️ Pinkerton is an JavaScript file crawler and secret finder tool developed in Python

crawl python crawler pentest python3 redteam secrets javascript hacktoberfest

Created 2022-06-10

80 commits to main branch, last one 11 months ago

laravel-site-search spatie

24

275

mit

6

Create a full-text search index by crawling your site

php site crawl search laravel hacktoberfest

Created 2021-09-14

236 commits to main branch, last one 6 months ago

fetchurls adamdehaven

45

128

mit

7

A bash script to spider a site, follow links, and fetch urls (with built-in filtering) into a generated text file.

urls wget crawl spider website shell-script bash-scripting

Created 2018-01-13

50 commits to master branch, last one 2 years ago

SpideyX RevoltSecurities

25

128

mit

2

SpideyX a multipurpose Web Penetration Testing tool with asynchronous concurrent performance with multiple mode and configurations.

crawl crawler crawling crawling-tool crawler-engine crawling-sites crawling-framework

Created 2024-09-19

20 commits to main branch, last one 2 months ago

crawlist WwwwwyDev

1

120

mit

1

A universal solution for web crawling lists. 抓取网页列表的通用解决方案

crawl python crawler reptile crawlist crawler-python crawling-python

Created 2024-04-03

65 commits to main branch, last one 7 months ago

wget-lua ArchiveTeam

15

107

gpl-3.0

20

Wget-AT is a modern Wget with Lua hooks, Zstandard (+dictionary) WARC compression and URL-agnostic deduplication.

ftp lua warc wget zstd crawl spider crawler scraper crawlers crawling scraping wget-lua archiving downloader archiveteam webarchiving

Created 2019-09-07

4,429 commits to v1.21.3-at branch, last one about a month ago

data-api scrapyman

5

105

unknown

5

Scrapyman数据接口服务。提供：淘宝、小红书、京东、抖音（电商）、抖音（视频）、快手、蒲公英、星图、拼多多、微信公众号、大众点评、哔哩哔哩、知乎、微博、贝壳、Bigo、Temu、Lazada、Shopee、SHEIN、百度指数、携程、Boss直聘、智联招聘、拉钩、今日头条、Facebook、Youtube、Instgram、Twitter。爬虫、采集、scrapy、接口、API。

api data crawl douyin taobao jingdong kuaishou pinduoduo pugongying taobao-api webcrawling xiaohongshu xiaohongshu-api

Created 2023-08-03

43,043 commits to main branch, last one 4 hours ago

pspider zhao94254

8

101

mit

4

一个简单的分布式爬虫框架

crawl celery python spider flask-api spider-framework

Created 2017-10-13

102 commits to master branch, last one 5 years ago

WebSecurityArticles zongdeiqianxing

20

80

unknown

6

爬取及整理Freebuf\安全客\先知\知道创宇等站点的”web安全“类优质文章

web crawl seebug vulhub crawler freebuf xianzhi anquanke articles security leavesongs

Created 2020-03-14

19 commits to master branch, last one a day ago

crawler-chrome-extensions zkqiang

14

76

mit

3

爬虫工程师常用的 Chrome 插件 | Chrome extensions used by crawler developer

crawl python spider awesome crawler scraper scraping awesome-list chrome-extension chrome-extensions

Created 2019-08-11

9 commits to master branch, last one 2 years ago

groqcrawl jgravelle

20

53

unknown

1

GroqCrawl is a powerful and user-friendly web crawling and scraping application built with Streamlit and powered by PocketGroq. It provides an intuitive interface for extracting LLM friendly AI consum...

web groq crawl scrape web-crawler web-scraping

Created 2024-10-08

10 commits to main branch, last one 2 months ago

gathertool mangenotwork

13

52

mit

3

gathertool是golang脚本化开发库，目的是提高对应场景程序开发的效率；轻量级爬虫库，接口测试&压力测试库，DB操作库等。

crawl golang spider grpc-go gathertool proxy-server spider-framework

Created 2021-04-23

196 commits to main branch, last one 8 months ago

crawl chieund

18

43

unknown

1

Teach daily is web crawl by GoLang from web dev.to, freecodecamp.com, medium.com, hashnode.com, logrocket.com,infoq.com

go gorm colly corba crawl gonic mysql nginx viper docker golang makefile typesense docker-compose

Created 2022-07-13

304 commits to master branch, last one 2 years ago