Trang 1 trên tổng số 2 12 Cuối cùngCuối cùng
Từ 1 tới 10 trên tổng số 19 kết quả

Đề tài: Cách lấy tóm tắt phần đầu của 1 tin tức

  1. #1
    Ngày gia nhập
    07 2011
    Bài viết
    20

    Mặc định Cách lấy tóm tắt phần đầu của 1 tin tức

    Mình đang cần liệt kê ra danh sách các tin tức, do vậy cần lấy tiêu đề với 300 ký tự đầu của tin tức đấy, vậy có thể làm thế nào được nhỉ? Trong phần tin tức thì mình lưu html, nếu lấy ra 300 ký tự có cả html thì khi hiển thị ra trình duyệt nó lại k đủ 300 ký tự, hơn nữa là lấy như vậy sợ là có thẻ mở html nhưng lại thiếu thẻ đóng? còn nếu k lấy html thì nó lại không có định dạng như bài viết. vậy bt các web tin tức họ làm thế nào nhỉ?

  2. #2
    Ngày gia nhập
    07 2011
    Bài viết
    20

    Trích dẫn Nguyên bản được gửi bởi luxubu Xem bài viết
    tuyệt .
    Spam hả bác? tóm dc roài nhé. he he.

  3. #3
    Ngày gia nhập
    06 2010
    Bài viết
    103

    Nói rõ hơn đi, cho cả ví dụ nữa, chứ nói không kiểu đó thì ai giúp nổi @@
    Rồi ta cũng sẽ khủng

  4. #4
    Ngày gia nhập
    11 2008
    Bài viết
    218

    Mình không rõ là các web tin tức họ là thế nào, nhưng nếu bạn chưa tham khảo được cách nào khác thì bạn có thể tạo thêm 1 field để lưu tiêu đề riêng. Tất nhiên cách này không hay nhưng dù sao cũng giải quyết được vấn đề.

    Chúc bạn thành công!

    __________________________________________________

    Đã được chỉnh sửa lần cuối bởi who_am_i : 08-08-2011 lúc 09:47 AM.

  5. #5
    Ngày gia nhập
    05 2010
    Bài viết
    505

    thông thường phải tách làm 2 phần riêng biệt, phần đầu và phần nội dung chính, vì nếu dùng chung và cắt lấy 300 ký tự đầu thì ngoài việc gặp vấn đề với các tag HTML như bạn nói thì còn vấn đề khác là câu cú văn bản sẽ bị gãy. Các website tin tức cũng phải làm vậy thôi.

  6. #6
    Ngày gia nhập
    07 2011
    Bài viết
    20

    Mặc định Cách lấy tóm tắt phần đầu của 1 tin tức

    Tức là phải nhập thủ công hả các bác? Liệu có tuyệt chiêu nào giải quyết dc không nhỉ? ví dụ như là trước khi nhập vào cơ sở dữ liệu thì ta lấy ra 300 ký tự trước rồi lưu vào chẳng hạn?

  7. #7
    Ngày gia nhập
    05 2010
    Bài viết
    505

    Trích dẫn Nguyên bản được gửi bởi BreakAll Xem bài viết
    Tức là phải nhập thủ công hả các bác? Liệu có tuyệt chiêu nào giải quyết dc không nhỉ? ví dụ như là trước khi nhập vào cơ sở dữ liệu thì ta lấy ra 300 ký tự trước rồi lưu vào chẳng hạn?
    ko ai làm như vậy cả, vì nếu cứ ép lấy đúng 300 ký tự đầu thì câu cú sẽ bị gẫy, vì dụ phần mở đầu của 1 bản tin là
    Trao đổi với Phóng viên Dân trí ngày 6/8, Thiếu tướng - Chính ủy Cục Cảnh sát biển Việt Nam Bùi Sĩ Trinh cho biết, chiếc máy bay đầu tiên được cảnh sát biển nghiệm thu hợp đồng sẽ bay sang Thụy Điển lắp thiết bị tuần thám và năm 2012 mới về Việt Nam
    giờ lấy 300 ký tự thì nó sẽ bị ngắt ngang, kiểu

    Trao đổi với Phóng viên Dân trí ngày 6/8, Thiếu tướng - Chính ủy Cục Cảnh sát biển Việt Nam Bùi Sĩ Trinh cho biết, chiếc máy bay đầu tiên được cảnh sát biển nghiệm thu hợp đồng sẽ bay...

  8. #8
    Ngày gia nhập
    07 2011
    Bài viết
    20

    Cái này mình vẫn thường thấy mà. vì bị ngắt ngang nên sau 300 ký tự mình sẽ để ... rồi ghi đọc tiếp vào đấy, có lẽ dùng chiêu gỡ mã html ra rồi dùng vậy-mỗi tội là cái này khá là khoai-topic thì nhiều nhưng giải pháp hoàn thiện thì vẫn chưa có. hihi. Ban đầu mình tạo topic này chỉ để xem 4rum mình xử lý lấy tóm tắt nội dung như thế này nên lubuxu vào mới thấy toàn asdfasdfasdf có im đậm in nghiêng, link, 4rum mình có mã lọc html khá chuẩn mỗi tội không biết mã đấy thế nào thôi.

  9. #9
    Ngày gia nhập
    05 2011
    Bài viết
    12

    Mặc định (có thể giúp ích)

    Nếu bạn lấy tin từ một trang có hổ trợ rss hay atom thì ok đấy.

    Ví dụ như link này chẳng hạn: http://vnexpress.net/rss/gl/vi-tinh.rss

  10. #10
    Ngày gia nhập
    05 2010
    Bài viết
    505

    Mặc định regular expression

    Bạn vẫn muốn "cố đấm ăn xôi" thì có thể dùng regular expression để gỡ hết các tag HTML đi và chỉ lấy phần nội dung thôi.

    Ví dụ 1 trình nhập liệu WYSIWYG của forum này cho đoan text màu mè như bên dưới:

    xanh đỏ tím vàng đậm

    sẽ có mã HTML là

    <tr><td class='alt1'><!-- icon and title --><div class='smallfont'><img class='inlineimg' src='images/icons/icon1.gif' alt='Mặc định' border='0' /></div><hr size='1' style='color:#A1D2F1; background-color:#A1D2F1' /><!-- / icon and title --><b><font color='Green'>xanh </font></b><i><font color='Red'>đỏ </font></i><font color='Purple'>tím </font><font color='Yellow'>vàng </font>đậm</td></tr>
    dùng regular expression để chỉ lấy ra nội dung thông thường

    Visual C# Code:
    1. String htmlDocument = "<tr><td class='alt1'><!-- icon and title --><div class='smallfont'><img class='inlineimg' src='images/icons/icon1.gif' alt='Mặc định' border='0' /></div><hr size='1' style='color:#A1D2F1; background-color:#A1D2F1' /><!-- / icon and title --><b><font color='Green'>xanh </font></b><i><font color='Red'>đỏ </font></i><font color='Purple'>tím </font><font color='Yellow'>vàng </font>đậm</td></tr>";
    2.             String result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty);

    khi đó result = xanh đỏ tím vàng đậm

    Việc còn lại là cắt chuỗi để lấy 300 ký tự đầu thôi

Các đề tài tương tự

  1. Tóm lược về viêm gan siêu vi C (HCV)
    Gửi bởi quynhcute trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 0
    Bài viết cuối: 13-08-2012, 10:41 PM
  2. Những thương vụ thâu tóm đình đám của Google
    Gửi bởi quynhcute trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 0
    Bài viết cuối: 12-08-2012, 03:16 PM
  3. Tóm được 1 member Anonymous là người Việt
    Gửi bởi kimlong008 trong diễn đàn Giải trí - Thư giãn
    Trả lời: 9
    Bài viết cuối: 25-02-2012, 08:47 AM
  4. Du học du lịch Mỹ - Tóm tắt ngắn gọn, cơ bản nền giáo dục Mỹ, của Tân Đại Dương
    Gửi bởi ctv180792 trong diễn đàn Giới thiệu website, sản phẩm của bạn
    Trả lời: 3
    Bài viết cuối: 02-05-2011, 09:58 AM

Quyền hạn của bạn

  • Bạn không thể gửi đề tài mới
  • Bạn không thể gửi bài trả lời
  • Bạn không thể gửi các đính kèm
  • Bạn không thể chỉnh sửa bài viết của bạn