如何使用Python抓取视频

如何使用Python抓取视频

如何使用Python抓取视频

  在本文中,我们将讨论使用 python 进行视频的网络抓取。对于网络抓取,我们将使用Python 中的requests 和 BeautifulSoup模块。requests库是 Python 的一个组成部分,用于向指定的 URL 发出 HTTP 请求。无论是 REST API 还是 Web Scraping,都必须了解请求才能进一步使用这些技术。当一个人向 URI 发出请求时,它会返回一个响应。

  推荐:如何计算Python列表长度

安装所需Python库

如何使用Python抓取视频

  Python  requests 提供了用于管理请求和响应的内置功能。

pip install requests

  BeautifulSoup是一个 Python 库,专为屏幕抓取等快速周转项目而设计。

pip install bs4

  推荐:Python中的Self

导入所需模块

import requests
from bs4 import BeautifulSoup

解析 HTML 内容

# Web URL
Web_url = "Enter WEB URL"

# Get URL Content
r = requests.get(Web_url)

# Parse HTML Code
soup = BeautifulSoup(r.content, 'html5lib')

  计算网页上有多少个视频。在 HTML 中为了显示视频,我们使用视频标签。

# List of all video tag
video_tags = soup.findAll('video')
print("Total ",len(video_tags),"videos found")

  推荐:常用的50个Python模块列表

  遍历所有视频标签并获取视频 URL

for video_tag in video_tags:
	video_url = video_tag.find("a")['href']
	print(video_url)

  下面是实现:

# Import Required Module
import requests
from bs4 import BeautifulSoup

# Web URL
Web_url = "https://www.geeksforgeeks.org/make-notepad-using-tkinter/"

# Get URL Content
r = requests.get(Web_url)

# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')

# List of all video tag
video_tags = soup.findAll('video')
print("Total ", len(video_tags), "videos found")

if len(video_tags) != 0:
	for video_tag in video_tags:
		video_url = video_tag.find("a")['href']
		print(video_url)
else:
	print("no videos found")

输出:
Total  1 videos found
https://media.geeksforgeeks.org/wp-content/uploads/15.webm

  推荐:Matplotlib Pyplot API概览

  推荐:Python OS函数模块


晓得博客,版权所有丨如未注明,均为原创
晓得博客 » 如何使用Python抓取视频

转载请保留链接:https://www.pythonthree.com/how-to-scrape-videos-using-python/

滚动至顶部