好口碑自適應網站建設優化建站
這種有規律的新聞列表 ,不過新聞的詳情內容需要再次單獨的去抓取,
代碼:
$url=//xxxx; // https://xxxx要抓取的鏈接 新聞列表
$url=str_replace('&','&',$url);
header("content-type:text/html;charset=utf-8");
$ch=curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);//除去https里面的s
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//關閉直接輸出
$ html_data 【網站開發報價】 =curl_exec($ch);
curl_close($ch);//關閉會話
這里要確認是否抓取到了頁面的內容 可以打印出來【建站公司】看一下
如果沒有抓取到 要注意一下 頁面的編碼格式 使用iconv()轉換一下內容編碼
// $html_data=iconv('gbk', 網絡營銷網站建設 'utf-8',$html_data);
$regular='#(.*?)(.*?)(.*?)(.*?)(.*?)(.*?)
(.*?)
#is';
preg_match_all($regular,$html_data,$connect);//進行正規匹配取得自己要的內容
//循環取出需要的內容數組
foreach($connect as $k=>$var){
if($k==2 || $k==3|| $k==5 || $k==7){
$b=array_merge(array_filter($connect[$k]));
$array[]=$b;
}
}
得到數據數組后 就可以根據需求去添加數據了
內容詳情需要抓取就獲取到新聞內容頁的鏈接 同樣使用curl去獲取信息
要注意的就是正則表達式里面的html需要跟頁面的格式一樣, 你可以去原網站點右鍵查看源代碼,查看格式, 把要抓取的html復制下來 ,如果還是有不能抓取的內容可能就是格式不正確 有可能有的地方是少空格或者多空格, 這個時候直接在標【網站制作運營與維護】簽之間(.*?)。也可以 一點一點的匹配 看具體是哪個部分沒有匹配到。
網絡為客戶提供網站開發定制服務,網站制作居于LINUX+PHP+MYSQL框架,歡迎客戶咨詢我們建站熱線400-8網站改版00-9385
哪里有賣網站制作 營銷型網站建設案例
我們憑借多年的網站建設經驗,堅持以“
幫助中小企業實現網絡營銷化”為宗旨,累計為4000多家客戶提供品質建站服務,得到了客戶的一致好評。如果您有網站建設、網站改版、域名注冊、主機空間、手機網站建設、網站備案等方面的需求...
請立即點擊咨詢我們或撥打咨詢熱線:
13968746378,我們會詳細為你一一解答你心中的疑難。
項目經理在線