用Python获取www.ironbar.cn的图片

要在 www.ironbar.cn 网站上使用Python的requests模块获取该网站内的所有图片，我们需要以下步骤：

1. 发送HTTP请求到该网站，获取网页内容。
2. 解析网页内容，提取所有图片的URL。
3. 下载或处理这些图片。

以下是具体的Python代码示例：

```python import requests from bs4 import BeautifulSoup import os # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36', 'Accept-Language': 'en-US,en;q=0.5', 'Accept-Encoding': 'gzip, deflate', 'Connection': 'keep-alive', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8' } # 获取网页内容 url = 'http://www.ironbar.cn' response = requests.get(url, headers=headers) response.raise_for_status() # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 提取所有图片的URL image_urls = [] for img_tag in soup.find_all('img'): img_url = img_tag.get('src') if img_url: # 处理相对路径 if not img_url.startswith('http'): img_url = requests.compat.urljoin(url, img_url) image_urls.append(img_url) # 输出所有图片URL for img_url in image_urls: print(img_url) # 可选：下载所有图片到本地目录 output_dir = 'images' os.makedirs(output_dir, exist_ok=True) for img_url in image_urls: img_response = requests.get(img_url, headers=headers) img_name = os.path.join(output_dir, os.path.basename(img_url)) with open(img_name, 'wb') as img_file: img_file.write(img_response.content) print(f'Downloaded {img_name}') ```

### 代码说明：

1. **请求头的设置**：`headers`是用来模拟浏览器发送请求，以避免被服务器拒绝。
2. **获取网页内容**：使用`requests.get`方法获取网页内容，并用BeautifulSoup解析HTML内容。
3. **提取图片URL**：通过BeautifulSoup找到所有`<img>`标签，并提取`src`属性。如果图片的URL是相对路径，通过`requests.compat.urljoin`方法将其转换为绝对路径。
4. **输出图片URL**：将所有图片的URL打印出来。
5. **下载图片（可选）**：将所有图片下载到本地目录`images`中。

### 运行环境：
– Python 3.x
– 需要安装`requests`和`beautifulsoup4`库，可以使用以下命令安装：
```bash pip install requests beautifulsoup4 ```

运行以上代码，你将能够获取并下载www.ironbar.cn网站上的所有图片。

评论

发送评论编辑评论

评论

发送评论 编辑评论

发送评论编辑评论