The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"Perl question"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы Программирование под UNIX (Public)
Изначальное сообщение [Проследить за развитием треда]

"Perl question" 
Сообщение от Alexandre emailИскать по авторуВ закладки(??) on 07-Апр-05, 21:59  (MSK)
Гуру Perl, простите, пожалуйста, за дурацкий/нагловатый вопрос/просьбу: есть ли готовый скрипт или что подобное?
Нужен скрипт, который на вход принимает HTML и, используя HTML-Tree, приводит этот самый ввод в более-менее нормальный вид.

Как я понимаю, это должно выглядеть примерно так (см. ниже).
Две проблемы: как сделать, чтобы содержимое (HTML_CONTENT) читалось из стандартного ввода и чтобы результат выдавался на стандартный вывод, а ошибки на стандартный error.

Помогите, пожалуйста, а то я в Perl, как свинья в апельсинах...

==================================
require HTML::Parser;
use HTML::Parser();

$p = HTML::Parser->new();
$p->parse(HTML_CONTENT);
$p->closing_plaintext(true);

  Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

  • Perl question, allez, 07:18 , 08-Апр-05, (1)  
    • Perl question, Alexandre, 09:06 , 08-Апр-05, (2)  

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "Perl question" 
Сообщение от allez Искать по авторуВ закладки(ok) on 08-Апр-05, 07:18  (MSK)
Встречный вопрос: а вам обязательно писать самому скрипт на Perl?
Дело в том, что с поставленной вами задачей прекрасно справляются
Lynx/Links с опцией -dump.

man lynx:
>       -dump  dumps the formatted output of the default  document
>              or  one  specified  on the command line to standard
>              output.  This can be used in the following way:
>
>              lynx -dump http://www.trill-home.com/lynx.html

links --help:
> -dump
>  Write a plain-text version of the given HTML document to
>  stdout.

Это не то, что вам нужно?

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "Perl question" 
Сообщение от Alexandre emailИскать по авторуВ закладки(??) on 08-Апр-05, 09:06  (MSK)
>Встречный вопрос: а вам обязательно писать самому скрипт на Perl?
>Дело в том, что с поставленной вами задачей прекрасно справляются
>Lynx/Links с опцией -dump.
<skipped>
>Это не то, что вам нужно?

Видимо, плохо выразился... =(
Дело в том, что мне нужен не дамп HTML, а приведение кривого HTML в более-менее нормальный вид.
Если я правильно понял, Perl's HTML::Parser пытается парсить также как и Internet Explorer, и, стало быть может выдать почти XHTML в результате своей деятельности. Вот именно это и интересно...

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх


Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру