PHP获取301跳转后的地址

本文将为大家介绍如何使用PHP获取301跳转后的地址。301重定向是什么呢?当我们访问一个网页A,但是它已经被迁移到了另一个地址B,此时若服务器端做了301重定向,那么你的浏览器在请求A的时候就会被直接跳转到B,这就是301重定向。在某些情况下,我们需要获取重定向后的地址,可能是为了获取正确的url或者为了数据分析等目的。接下来将从多个方面为大家详细介绍。

一、使用cURL获取301跳转后的地址

PHP的cURL库是一个非常强大的库,用来处理各种网络请求问题。我们可以通过cURL获取301跳转后的地址。使用cURL获取301地址的过程比较简单,具体操作步骤如下:

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.google.com');
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

$redirect_url = curl_exec($ch);

echo "Redirect URL: ".$redirect_url;

执行上述代码,我们就可以获取到301跳转后的地址。首先使用curl_init()初始化一个cURL句柄,然后使用curl_setopt()为句柄设置选项。我们需要设置CURLOPT_FOLLOWLOCATION为true,这样cURL就可以自动跟随所有重定向。最后使用curl_exec()执行请求,将返回重定向后的地址。

二、使用PHP的header函数获取301跳转后的地址

PHP的header函数是用来发送HTTP头部信息的,它也可以用来获取301跳转后的地址。header函数的第二个参数,如果设置为true,就可以获取HTTP头部信息。具体操作步骤如下:

$url = 'http://www.google.com';
$headers = get_headers($url, 1);

if (strpos($headers[0], '301') !== false)
{
    $redirect_url = $headers['Location'];
    echo "Redirect URL: ".$redirect_url;
}

首先我们使用get_headers()函数获取HTTP头部信息,然后如果首行包含“301”字符串,就认为有重定向,此时我们可以使用$headers[‘Location’]获取重定向后的地址。

三、使用模拟浏览器的方式获取301跳转后的地址

有些网站会检查请求来自浏览器还是爬虫,如果检测到是爬虫就会直接返回404错误,即使请求的地址是正确的。我们可以使用PHP的模拟浏览器方式来获取301跳转后的地址。使用模拟浏览器的方式比较灵活,可以自由设置请求头、cookie等信息。具体操作步骤如下:

$url = 'http://www.google.com';

$useragent = "Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US) AppleWebKit/525.19 (KHTML, like Gecko) Chrome/1.0.154.65 Safari/525.19";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

$redirect_url = curl_exec($ch);

echo "Redirect URL: ".$redirect_url;

首先我们设置了一个自定义的User-agent,然后使用cURL访问目标网站。curl_setopt()函数和上述相同,我们需要设置CURLOPT_RETURNTRANSFER为true,这样curl_exec()函数就不会直接输出内容。最后使用curl_exec()函数将返回重定向后的地址。

四、使用重定向事件来获取301跳转后的地址

如果网站使用了JavaScript跳转,那么使用上述方式就无法获取跳转后的地址。这时我们可以使用JavaScript的重定向事件来获取跳转后的地址。具体操作步骤如下:

$url = 'http://www.google.com';

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$response = curl_exec($ch);

preg_match_all('/

本文链接:https://my.lmcjl.com/post/5580.html

展开阅读全文

4 评论

留下您的评论.