梦殇国际

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 刷粉
月光下载 云刷粉软件 云刷粉网页 水贴机电脑版 安卓软件 梦殇导航(教程集合) 有任何问题请点击提问
查看: 673|回复: 11
打印 上一主题 下一主题

Python获取所有我喜欢的贴吧名字+等级+经验值

[复制链接]

4万

帖子

8560

积分

2785

TBS

UID
4
积分
8560
TBS
2785
智商
23016
节操
22097
海贝
1681
阅读权限
200
在线时间
3113 小时
注册时间
2014-1-1
最后登录
2024-11-16

在线时间长爱心大使梦殇元老

QQ
跳转到指定楼层
1
发表于 2016-5-9 21:49:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
python贴吧登陆+获取我喜欢的贴吧名字、贴吧的fid、贴吧等级、贴吧经验值、贴吧链接
执行结果:

代码:
  1. # coding:utf-8
  2. '''
  3. Created on 2016年5月2日

  4. @author: hisenyuan
  5. '''
  6. from bs4 import BeautifulSoup
  7. import urllib2
  8. import urllib
  9. import cookielib
  10. import re
  11. import json
  12. from pip._vendor import requests

  13. URL_BAIDU_INDEX = u'http://www.baidu.com/';
  14. # https://passport.baidu.com/v2/api/?getapi&class=login&tpl=mn&tangram=true 也可以用这个
  15. URL_BAIDU_TOKEN = 'https://passport.baidu.com/v2/api/?getapi&tpl=pp&apiver=v3&class=login';
  16. URL_BAIDU_LOGIN = 'https://passport.baidu.com/v2/api/?login';

  17. # 设置用户名、密码
  18. username = '梦殇国际';  #
  19. password = 'www.714.hk';  #

  20. # 设置cookie,这里cookiejar可自动管理,无需手动指定
  21. cj = cookielib.CookieJar();
  22. opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj));
  23. urllib2.install_opener(opener);
  24. reqReturn = urllib2.urlopen(URL_BAIDU_INDEX);

  25. # 获取token,
  26. tokenReturn = urllib2.urlopen(URL_BAIDU_TOKEN);
  27. matchVal = re.search(u'"token" : "(?P<tokenVal>.*?)"', tokenReturn.read());
  28. tokenVal = matchVal.group('tokenVal');


  29. # 构造登录请求参数,该请求数据是通过抓包获得,对应https://passport.baidu.com/v2/api/?login请求
  30. postData = {
  31. 'username' : username,
  32. 'password' : password,
  33. 'u' : 'https://passport.baidu.com/',
  34. 'tpl' : 'pp',
  35. 'token' : tokenVal,
  36. 'staticpage' : 'https://passport.baidu.com/static/passpc-account/html/v3Jump.html',
  37. 'isPhone' : 'false',
  38. 'charset' : 'UTF-8',
  39. 'callback' : 'parent.bd__pcbs__ra48vi'
  40. };
  41. postData = urllib.urlencode(postData);


  42. # 发送登录请求
  43. loginRequest = urllib2.Request(URL_BAIDU_LOGIN, postData);
  44. loginRequest.add_header('Accept', 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8');
  45. loginRequest.add_header('Accept-Encoding', 'gzip,deflate,sdch');
  46. loginRequest.add_header('Accept-Language', 'zh-CN,zh;q=0.8');
  47. loginRequest.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36');
  48. loginRequest.add_header('Content-Type', 'application/x-www-form-urlencoded');
  49. sendPost = urllib2.urlopen(loginRequest);


  50. # 查看贴吧个人主页 ,测试是否登陆成功,由于cookie自动管理,这里处理起来方便很多
  51. # http://tieba.baidu.com/home/main?un=XXXX&fr=index 这个是贴吧个人主页,各项信息都可以在此找到链接

  52. # 获取我喜欢的贴吧页数,一页20个
  53. def getnum():
  54.     url_forum = 'http://tieba.baidu.com/i/68449687/forum'
  55.     r2 = requests.get(url_forum)
  56.     search = re.findall(ur'forum_name":"(.+?)"', r2.text)
  57.     num_forum = len(search)
  58.     if num_forum % 20 != 0:
  59.         num_forum = num_forum / 20 + 1
  60.     return num_forum




  61. #获取我喜欢的贴吧信息
  62. def getinfo(num):
  63.     start = 1;
  64.     print '吧名\t\t贴吧fid\t\t等级\t\t经验\t贴吧链接';
  65.     while(start <= num):
  66.         teibaUrl = 'http://tieba.baidu.com/f/like/mylike?&pn=' + str(start);
  67.         start = start + 1;
  68.         content = urllib2.urlopen(teibaUrl).read();
  69.         content = content.decode('gbk').encode('utf8');
  70.         # 打印个人贴吧网页内容
  71.         # print content;
  72.         
  73.         # 解析数据,用的BeautifulSoup4,感觉没有jsoup用的爽
  74.         soup = BeautifulSoup(content, 'html.parser');
  75.         list = soup.findAll('tr');
  76.         list = list[1:len(list)];
  77.         # careTeibalist = [];
  78.         for elem in list:
  79.             soup1 = BeautifulSoup(str(elem), 'html.parser');
  80.             # 获取fid的前缀网址,等号后面跟贴吧名字的URL编码
  81.             url1 = 'http://tieba.baidu.com/f/commit/share/fnameShareApi?ie=utf-8&fname=';
  82.             # /f?kw=%D3%A2%D0%DB%C1%AA%C3%CB 截取后面的%D3%A2%D0%DB%C1%AA%C3%CB
  83.             name = soup1.find('a')['href'].split('=')[1];
  84.             # 解析json
  85.             fidconnect = urllib2.urlopen(url1 + name).readline();
  86.             fid = json.loads(fidconnect)['data']['fid'];
  87.             print soup1.find('a')['title'] + '\t\t' + '%d' % fid + '\t\t' + soup1.find('a', {'class', 'like_badge'})['title'] + '\t\t' + soup1.find('a', {'class', 'cur_exp'}).get_text() + '\t' + 'http://tieba.baidu.com' + soup1.find('a')['href'];

  88. #获取页数
  89. num = getnum();
  90. #获取信息
  91. getinfo(num)
复制代码


把里面的帐号密码设置成你自己的即可
python2即可运行
有兴趣的可以试一试,或者网上去搜索一下
很多源码可以参考,自己做点小工具什么的还是可以



全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复

使用道具 举报

136

帖子

64

积分

285

TBS

UID
63694
积分
64
TBS
285
智商
435
节操
120
海贝
34
阅读权限
20
在线时间
13 小时
注册时间
2015-6-17
最后登录
2018-4-9
2
发表于 2016-5-9 23:00:47 | 只看该作者
谢谢分享
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复

使用道具 举报

394

帖子

1071

积分

874

TBS

UID
16399
积分
1071
TBS
874
智商
1764
节操
1879
海贝
894
阅读权限
50
在线时间
464 小时
注册时间
2014-8-12
最后登录
2020-11-1
3
发表于 2016-5-10 03:10:21 | 只看该作者
不会编程,谁做个现成的吧

点评

这就是现成的  详情 回复 发表于 2016-5-10 07:52
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复 支持 反对

使用道具 举报

4万

帖子

8560

积分

2785

TBS

UID
4
积分
8560
TBS
2785
智商
23016
节操
22097
海贝
1681
阅读权限
200
在线时间
3113 小时
注册时间
2014-1-1
最后登录
2024-11-16

在线时间长爱心大使梦殇元老

QQ
4
 楼主| 发表于 2016-5-10 07:52:22 | 只看该作者
leeds 发表于 2016-5-10 03:10
不会编程,谁做个现成的吧

这就是现成的
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复 支持 反对

使用道具 举报

97

帖子

93

积分

104

TBS

UID
95805
积分
93
TBS
104
智商
250
节操
244
海贝
69
阅读权限
20
在线时间
22 小时
注册时间
2015-12-8
最后登录
2016-12-21
5
发表于 2016-5-10 10:21:03 | 只看该作者
我就喜欢帅哥
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复 支持 反对

使用道具 举报

387

帖子

150

积分

812

TBS

UID
118144
积分
150
TBS
812
智商
878
节操
601
海贝
53
阅读权限
20
在线时间
35 小时
注册时间
2016-4-25
最后登录
2019-7-25
6
发表于 2016-5-10 10:26:23 | 只看该作者
这个不懂怎么用
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复 支持 反对

使用道具 举报

726

帖子

330

积分

793

TBS

UID
58016
积分
330
TBS
793
智商
1026
节操
1013
海贝
209
阅读权限
30
在线时间
105 小时
注册时间
2015-5-26
最后登录
2017-3-29
7
发表于 2016-5-10 11:03:00 | 只看该作者
什么~
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复

使用道具 举报

1万

帖子

4323

积分

1万

TBS

无力感占据生活的大部分时刻。

UID
35479
积分
4323
TBS
10297
智商
20330
节操
17941
海贝
615
阅读权限
222
在线时间
1006 小时
注册时间
2015-2-3
最后登录
2024-8-1
8
发表于 2016-5-10 11:26:16 | 只看该作者
嗦嘎
超级怕麻烦
欢迎无团人士加入『MSI』-『暗晓』 155292007
回复

使用道具 举报

116

帖子

48

积分

20

TBS

UID
64306
积分
48
TBS
20
智商
173
节操
167
海贝
27
阅读权限
0
在线时间
22 小时
注册时间
2015-6-19
最后登录
2019-7-13
9
发表于 2016-7-20 16:00:10 | 只看该作者
高大上的样子
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复 支持 反对

使用道具 举报

8

帖子

3

积分

27

TBS

UID
131418
积分
3
TBS
27
智商
17
节操
15
海贝
1
阅读权限
0
在线时间
0 小时
注册时间
2016-7-20
最后登录
2016-7-20
10
发表于 2016-7-20 17:09:06 | 只看该作者
不错不错哈
全站禁止灌水,后果自负 月光爆吧器 积分充值 签名档设置 积分记录 新人必备
梦殇qq群 欢迎加入群内禁止传播黄色信息!
①群:515706814 爆吧□顶贴□机器 ②群:94025161 贴吧推广□爆吧□软件 ③群:549343908 营销推广□贴吧□软件
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

GMT+8, 2024-11-16 01:20,Processed in 0.071520 second(s), 35 queries.

Powered by Discuz!X3.4© 2001-2013 Comsenz Inc. 手机版|黑名单|站点地图|RGB转16进制|梦殇国际 MSI

贴吧交流群:172119290 | 编程交流群:232677917 | 官方YY频道:13234704 | 本站所有软件仅供学习交流使用!

工信部备案:赣ICP备14004172号-1 | 如有需要请联系 邮箱:541641237#qq.com (点击发邮件)

快速回复 返回顶部 返回列表