Từ 1 tới 3 trên tổng số 3 kết quả

Đề tài: Không lấy được nội dung html của một url, nguyên nhân do đâu?

  1. #1
    Ngày gia nhập
    09 2011
    Bài viết
    3

    Mặc định Không lấy được nội dung html của một url, nguyên nhân do đâu?

    Chào các bạn ở cộng đồng C Việt. Mình có đoạn mã đọc nội dung file html qua một địa chỉ url

    Code:
    string ReadUrl(string url)
        {
            Uri uri = new Uri(url);
            
            //Create the request object
            
            WebRequest req = WebRequest.Create(uri);
            WebResponse resp = req.GetResponse();
            Stream stream = resp.GetResponseStream();
            StreamReader sr = new StreamReader(stream);
            
            string s = sr.ReadToEnd();
            
            return(s);
            
        }
    Với hầu hết các url thì hàm ReadUrl trả về với nội dung đúng với nội dung của file html. Tuy nhiên với website http://www.doanhnhan360.com thì ngược lại. Trong khi đó mình viết bằng Java thì lấy được

    Mình không biết lý do tại sao?
    Mong các bạn giúp đỡ

  2. #2
    Ngày gia nhập
    10 2009
    Nơi ở
    Close All
    Bài viết
    993

    Trích dẫn Nguyên bản được gửi bởi cuongcnb Xem bài viết
    Chào các bạn ở cộng đồng C Việt. Mình có đoạn mã đọc nội dung file html qua một địa chỉ url

    Code:
    string ReadUrl(string url)
        {
            Uri uri = new Uri(url);
            
            //Create the request object
            
            WebRequest req = WebRequest.Create(uri);
            WebResponse resp = req.GetResponse();
            Stream stream = resp.GetResponseStream();
            StreamReader sr = new StreamReader(stream);
            
            string s = sr.ReadToEnd();
            
            return(s);
            
        }
    Với hầu hết các url thì hàm ReadUrl trả về với nội dung đúng với nội dung của file html. Tuy nhiên với website http://www.doanhnhan360.com thì ngược lại. Trong khi đó mình viết bằng Java thì lấy được

    Mình không biết lý do tại sao?
    Mong các bạn giúp đỡ
    Thông thường các trang nó không cần xác nhận UserAgent.
    Nhưng 1 số trang thì có .Nên nó đòi hỏi Request của bạn là từ 1 UserAgent cụ thể
    Mà trang trên có bắt buộc,mà bạn không set UserAgent cho request nên trang đó từ chối kết nối của bạn thôi.

    Ví dụ đây là 1 :
    Visual C# Code:
    1. HttpWebRequest httpRequest=......;
    2. httpRequest.UserAgent ="Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)";
    nGOÀI ra bạn cần để ý vài Error nữa: 406 Not Acceptance ( request header thiếu trường Accept ),..vv
    Đã được chỉnh sửa lần cuối bởi tauit_dnmd : 26-09-2011 lúc 01:53 PM.

  3. #3
    Ngày gia nhập
    09 2011
    Bài viết
    3

    Trích dẫn Nguyên bản được gửi bởi tauit_dnmd Xem bài viết
    Thông thường các trang nó không cần xác nhận UserAgent.
    Nhưng 1 số trang thì có .Nên nó đòi hỏi Request của bạn là từ 1 UserAgent cụ thể
    Mà trang trên có bắt buộc,mà bạn không set UserAgent cho request nên trang đó từ chối kết nối của bạn thôi.

    Ví dụ đây là 1 :
    Visual C# Code:
    1. HttpWebRequest httpRequest=......;
    2. httpRequest.UserAgent ="Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)";
    nGOÀI ra bạn cần để ý vài Error nữa: 406 Not Acceptance ( request header thiếu trường Accept ),..vv
    Cảm ơn tauit_dnmd nhiều!!!

Các đề tài tương tự

  1. Xin hướng dẫn cách trích rút nội dung trong HTML ....
    Gửi bởi longnhkse60984 trong diễn đàn Nhập môn lập trình Java
    Trả lời: 2
    Bài viết cuối: 12-09-2015, 11:33 AM
  2. Làm sao để lấy tất cả nội dung trang html?
    Gửi bởi lion080889 trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 13
    Bài viết cuối: 09-08-2013, 08:30 AM
  3. Đọc nội dung HTML để lấy link nhạc được tìm kiếm
    Gửi bởi cauutnin trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 3
    Bài viết cuối: 05-10-2012, 10:13 AM
  4. lấy nội dung file html có chọn lọc như thế nào?
    Gửi bởi pkthanh92 trong diễn đàn Thắc mắc lập trình Visual C++
    Trả lời: 5
    Bài viết cuối: 01-10-2011, 10:19 AM
  5. Đọc nội dung file HTML bằng C#
    Gửi bởi nvbachau trong diễn đàn Thắc mắc lập trình C#
    Trả lời: 2
    Bài viết cuối: 05-05-2010, 09:16 PM

Tags của đề tài này

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn