Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于一个章节正文里有分页的问题 #1

Open
qingshujun opened this issue Oct 10, 2022 · 2 comments
Open

关于一个章节正文里有分页的问题 #1

qingshujun opened this issue Oct 10, 2022 · 2 comments

Comments

@qingshujun
Copy link

你好,请教一下,最近在试着写源文件,遇到一个网站https://www.23qb.net/book/8519/4808035_2.html,这个网站每章的正文分成了两页,正文我使用//div[@id="TextContent"]/p/text()这样的方式获取,但是本章节下一页就不知道要怎么写了。

@UFOAlastor
Copy link
Owner

你好,请教一下,最近在试着写源文件,遇到一个网站https://www.23qb.net/book/8519/4808035_2.html,这个网站每章的正文分成了两页,正文我使用//div[@id="TextContent"]/p/text()这样的方式获取,但是本章节下一页就不知道要怎么写了。

点击链接加入讨论子频道【🔨技术讨论】:https://pd.qq.com/s/tu5obl
我推荐你去香色闺阁的QQ频道询问,有更多大佬可以给你及时回复。关于你这个问题,大致的思路是URL上_2表示第二页,那么可以在香色闺阁内容部分的下一页链接部分里写一个js函数处理当前第一页的URL,加上_2得到第二页的URL。具体的实现你可以去群里问。

@qingshujun
Copy link
Author

你好,请教一下最近在试写源文件,网站https://www.23qb.net/835519/4808035_2.,这个网站每章的正文/我的正文是两页, //div[@id=" TextContent"]/p/text() 以这种方式,但是本章节的下一页接下来要怎么写了。

点击加入链接讨论子频道【🔨技术知识】:https : //pd.qq.com/stu5obl推荐我给你推荐你的香闺阁的QQ频道查询,有更多可以给你色的及时讨论关于问题。你这个问题,回复大佬的思路是网址上_2表示第二页,那么就可以在香色闺阁内容部分的链接部分里写一个js函数处理当前第一页的URL,加上_2第二页的URL。具体的实现你可以去群里问。

好的,谢谢你的回复。一开始看到网址时,也是想到加_2这个方式。
思路的话,应该是从上一步骤响应的链接获取链接里的两段数字(目录页/正文页),然后用https://www.23qb.net/+数字.html构成正文网址作为请求信息,下一页网址在最后一个数字加上_2这样。不过不是程序员出生,正则表达这些以前也没接触出,还有就是文章内容里一些字和谐的比较多,现在放弃这个网站了,因为其他一些网站下一页都是href带链接方式,就这一个不一样;至于这个问题留着过后再解决。
最近https://github.com/opa334/TrollStore这个免签工具更新了,可以用来装应用。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants