|
Вариант для распечатки |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от opennews (ok) on 13-Июл-16, 20:16 | ||
После нескольких месяцев разработки увидел свет первый релиз (https://github.com/lexborisov/myhtml/releases/tag/v1.0.1) быстрого HTML парсера MyHTML (https://github.com/lexborisov/myhtml/). Код написан на языке Си и распространяется под лицензией LGPL v2.1. | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения по теме | [Сортировка по времени | RSS] |
1. "Первый релиз многопоточного HTML-парсера MyHTML" | +3 +/– | |
Сообщение от neon1ks (ok) on 13-Июл-16, 20:16 | ||
Круть!) | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
52. "Первый релиз многопоточного HTML-парсера MyHTML" | –17 +/– | |
Сообщение от Rodegast (??) on 14-Июл-16, 11:21 | ||
Вот было бы на haskell-е, тогда бы была бы действительно круть... | ||
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору |
54. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Вадик (??) on 14-Июл-16, 12:10 | ||
Ну а смысл. C достаточно универсален. Биндинги к нему напилить и все круто будет. А хаскель...да, мы любим хаскель. | ||
Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору |
88. "Первый релиз многопоточного HTML-парсера MyHTML" | –2 +/– | |
Сообщение от Rodegast (??) on 14-Июл-16, 14:46 | ||
Ну как минимум с многопоточностью у haskell-а дела обстоят лучше. | ||
Ответить | Правка | ^ к родителю #54 | Наверх | Cообщить модератору |
110. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Uri (??) on 14-Июл-16, 18:08 | ||
Эммм, что-что? | ||
Ответить | Правка | ^ к родителю #88 | Наверх | Cообщить модератору |
134. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Rodegast (??) on 14-Июл-16, 21:52 | ||
Конечно. Аппликативный код распараллеливается лучше итеративного. При словах "многопоточного HTML-парсера" у меня первая мысль была об erlang-е, но я подумал и всё-таки написал про haskell. | ||
Ответить | Правка | ^ к родителю #110 | Наверх | Cообщить модератору |
161. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 21:22 | ||
> Конечно. Аппликативный код распараллеливается лучше итеративного. При словах "многопоточного | ||
Ответить | Правка | ^ к родителю #134 | Наверх | Cообщить модератору |
116. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 18:40 | ||
А со сборкой мусора? Будет ли код такой же быстрый как и на си? | ||
Ответить | Правка | ^ к родителю #88 | Наверх | Cообщить модератору |
136. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Rodegast (??) on 14-Июл-16, 22:05 | ||
Насколько гипотетический парсер на haskell-е будет быстрее|медленнее сабжа сказать трудно. Но достаточно быстрый парсер написать можно. См. ссылку ниже. | ||
Ответить | Правка | ^ к родителю #116 | Наверх | Cообщить модератору |
141. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 23:13 | ||
зачем такому проекту сборщик? | ||
Ответить | Правка | ^ к родителю #116 | Наверх | Cообщить модератору |
62. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от rob pike on 14-Июл-16, 13:02 | ||
https://github.com/bazqux/fast-tagsoup | ||
Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору |
89. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Rodegast (??) on 14-Июл-16, 14:48 | ||
Оно что-то давно не обновлялось, хотя скорость 20-200MB/sec это более чем круть ;) | ||
Ответить | Правка | ^ к родителю #62 | Наверх | Cообщить модератору |
124. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Vombat on 14-Июл-16, 19:34 | ||
А что сложного написать? Поставь задачу и вперед. | ||
Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору |
160. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 21:21 | ||
> Вот было бы на haskell-е, тогда бы была бы действительно круть... | ||
Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору |
2. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от G.NercY.uR on 13-Июл-16, 20:16 | ||
Написано всё очень оптимистично и красиво! Это в итоге использовать можно будет для построения браузерного движка или какие у этого парсера предназначения? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
3. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от НяшМяш (ok) on 13-Июл-16, 20:21 | ||
Судя по тому, что будут писать рендер, да ещё и MyCSS на подходе - есть все шансы увидеть новый браузер. | ||
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору |
5. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от rob pike on 13-Июл-16, 20:27 | ||
Нету. Главное это layout, rendering и Javascript. | ||
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору |
14. "Первый релиз многопоточного HTML-парсера MyHTML" | +8 +/– | |
Сообщение от lastmac on 13-Июл-16, 22:23 | ||
layout, reflow and other | ||
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору |
16. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 13-Июл-16, 22:30 | ||
Это вы отрисовку шрифтов к other отнесли? | ||
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору |
17. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Аноним (??) on 13-Июл-16, 22:35 | ||
А куда её отнести? Или отрисовка шрифтов -- это ключевое что есть? | ||
Ответить | Правка | ^ к родителю #16 | Наверх | Cообщить модератору |
18. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 13-Июл-16, 22:58 | ||
В те 10% задачи, которые займут 90% времени. | ||
Ответить | Правка | ^ к родителю #17 | Наверх | Cообщить модератору |
105. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 17:16 | ||
Есть большая разница между отрендерить шрифт и отрендерить шрифт с антиалисами на ретина дисплее. | ||
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору |
119. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 18:51 | ||
Во-первых, это забота библиотек. | ||
Ответить | Правка | ^ к родителю #105 | Наверх | Cообщить модератору |
149. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 09:20 | ||
поехавшие шрифты != поехавшие сайты. | ||
Ответить | Правка | ^ к родителю #119 | Наверх | Cообщить модератору |
26. "Первый релиз многопоточного HTML-парсера MyHTML" | +4 +/– | |
Сообщение от G.NercY.uR on 14-Июл-16, 06:05 | ||
Уважаемый, если вы не измените своим принципам и до конца будете идти по пути качественного кода, с упором на скорость и минимальные потребляемые ресурсы, и в итоге если ещё появится браузер, которым можно будет пользоваться на системе с 256 мегами памяти, то мой вам поклон и запись в постоянные донейторы вашего проекта. | ||
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору |
34. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 08:50 | ||
Вообще-то один из простых способов получить скорость и компактность - не давать страницам делать лишнего. Ну там - дефолтное полное отключение JS в неактивных вкладках (с белым списком, конечно), а тои полная выгрузка уже распарсенного и загруженного контента в каких-то разумных (вероятно, слегка сжатых чем-то быстрым вроде imagezero и подобных) форматах на диск, возможность прервать исполнение уже загруженного и запущенного JS и тому подобное. И этого всего в существующих браузерах здорово не хватает. | ||
Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору |
47. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от тоже Аноним (ok) on 14-Июл-16, 10:51 | ||
Секрет в том, что тормоза в браузерах и оплата их разработки идут из одного источника - рекламных сетей. Браузер со встроенной изначально резалкой шлака будет заметно быстрее Хрома, например, даже в том случае, если будет просто Хромиумом со встроенной резалкой шлака. | ||
Ответить | Правка | ^ к родителю #34 | Наверх | Cообщить модератору |
56. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 12:21 | ||
Я скорее согласен, чем нет. Речь была о том, что это (условно) простой путь получить конкурентоспособный браузер. Но да, финансировать придётся за счёт краудфандинга. | ||
Ответить | Правка | ^ к родителю #47 | Наверх | Cообщить модератору |
68. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:17 | ||
В принципе, совсем необязательно. Есть какое-то количество ниш, в которых был бы очень востребован быстрый браузер, потребляющий минимальное количество ресурсов, а ограниченность возможностей была бы только дополнительным плюсом - автомобильная индустрия, например, или управление промышленным оборудованием. | ||
Ответить | Правка | ^ к родителю #56 | Наверх | Cообщить модератору |
72. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 13:41 | ||
Нет там никаких проблем с ресурсами - ни в делах автомобильных, ни в промышленности, куда частенько вообще ПК пихают в железном ящике. Ограничение фич при нужде в движках тоже предусмотрено. | ||
Ответить | Правка | ^ к родителю #68 | Наверх | Cообщить модератору |
80. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 14:18 | ||
И проблемы с ресурсами есть, и с ограничением фич всё очень плохо. | ||
Ответить | Правка | ^ к родителю #72 | Наверх | Cообщить модератору |
90. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 14:56 | ||
Архитектура "хребет + плагины, которые можно цеплять цепочками", в общем-то, не так уж сложна. То, что плагин становится сишной либой - не проблема, если надо - интерфейс к другим языкам делается отдельно. | ||
Ответить | Правка | ^ к родителю #80 | Наверх | Cообщить модератору |
96. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 15:35 | ||
Она "не сложна" ровно до момента её имплементации. Особенно вместе требованиями по производительности. | ||
Ответить | Правка | ^ к родителю #90 | Наверх | Cообщить модератору |
118. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 18:44 | ||
Да делана такая архитектура сто раз (и мной в том числе) - нет ничего великого в ней. Производительность перестаёт быть проблемой как только перестаёшь видеть плагины как нечто страшное, внешнее и недоверенное. Если у них те же права, что и у остального кода (и они, соответственно, могу всё завалить, конечно) - то всё в порядке. | ||
Ответить | Правка | ^ к родителю #96 | Наверх | Cообщить модератору |
128. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 21:33 | ||
Хорошая архитектура препятствует набеганию тысяч неквалифицированных разработчиков, которые левой пяткой запиливают тысячи плагинов, не умея ни читать ни писать. | ||
Ответить | Правка | ^ к родителю #118 | Наверх | Cообщить модератору |
143. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 15-Июл-16, 00:02 | ||
Тогда у нас очень разные понятия о хорошей архитектуре. Вопрос, в общем-то, не в том, сколько тысяч кривых плагинов, а в том, чтобы от них можно было легко отличить не кривые. А так - если каждый может для себя сделать какую-то кастомизацию - это и есть система для power user'ов. Тот же unix shell с утилитами и пайпами взять - они пишут себе какие-то спеифические домашние скрипты, от которых production quality никто в здравом уме и не ждёт - зато точно под конкретные условия. | ||
Ответить | Правка | ^ к родителю #128 | Наверх | Cообщить модератору |
147. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 07:57 | ||
зачем тебе unix shell убогий? твое корыто это systemd - вот жри его и вперед :) | ||
Ответить | Правка | ^ к родителю #143 | Наверх | Cообщить модератору |
67. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:15 | ||
Вы опять главного не сказали - за этим стоят Ротшильды или Рокфеллеры? | ||
Ответить | Правка | ^ к родителю #47 | Наверх | Cообщить модератору |
117. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 18:44 | ||
К сожалению тут надо очень долго возится, иначе сайты получятся совсем не юзабельными | ||
Ответить | Правка | ^ к родителю #34 | Наверх | Cообщить модератору |
165. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 16-Июл-16, 04:18 | ||
> Вообще-то один из простых способов получить скорость и компактность - не давать | ||
Ответить | Правка | ^ к родителю #34 | Наверх | Cообщить модератору |
50. "Первый релиз многопоточного HTML-парсера MyHTML" | +4 +/– | |
Сообщение от lastmac on 14-Июл-16, 11:04 | ||
> Уважаемый, если вы не измените своим принципам и до конца будете идти | ||
Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору |
37. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 09:37 | ||
Вы правда (если это вы) собираетесь в одиночку сделать конкурента Firefox и Chrome? Либо вы гений, либо глупец. | ||
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору |
41. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 10:17 | ||
Или умный человек, способный поставить задачу премлемого масштаба, не пытаясь реализовать всё, что понапихали в этих кадавров. Ну и читайте внимательнее то, на что отвечаете - "возможно скоро я буду делать его не один." | ||
Ответить | Правка | ^ к родителю #37 | Наверх | Cообщить модератору |
64. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:06 | ||
Заодно можно реализовать много другого. | ||
Ответить | Правка | ^ к родителю #41 | Наверх | Cообщить модератору |
42. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Sen on 14-Июл-16, 10:31 | ||
где-то это было... А точно Линуксу этоже сказали в своё время... И да Google тоже из тех же ребят))) | ||
Ответить | Правка | ^ к родителю #37 | Наверх | Cообщить модератору |
49. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от lastmac on 14-Июл-16, 10:59 | ||
> Вы правда (если это вы) собираетесь в одиночку сделать конкурента Firefox и | ||
Ответить | Правка | ^ к родителю #37 | Наверх | Cообщить модератору |
57. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от G.NercY.uR on 14-Июл-16, 12:25 | ||
Автор как я считаю, пример исчезающих к сожалению, романтиков IT отрасли. Это раньше корпели над тем, как бы изящней, да эффективней написать каждый кусок кода, сейчас же никого не волнуют такие формальности. | ||
Ответить | Правка | ^ к родителю #49 | Наверх | Cообщить модератору |
60. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 12:36 | ||
Вокруг 4 браузера. Chrome, Edge, Mozilla, Safari. То, что на движки хрома ещё пара десятков команд натянула свои шкурки (и парочка на мозилловские), ничего не меняет. | ||
Ответить | Правка | ^ к родителю #57 | Наверх | Cообщить модератору |
69. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:23 | ||
Есть несколько экспериментально-академических движков - ну, не движков, а proof of concept поделок. | ||
Ответить | Правка | ^ к родителю #60 | Наверх | Cообщить модератору |
73. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от vitalif (ok) on 14-Июл-16, 13:42 | ||
ты кстати зря, firefox за это время например ускорился и течь таки меньше стал | ||
Ответить | Правка | ^ к родителю #57 | Наверх | Cообщить модератору |
77. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 14:00 | ||
Ну вот Mozilla переписала с нуля движок на Rust. Как до хотя бы до беты дойдет посмотрим, как оно. | ||
Ответить | Правка | ^ к родителю #57 | Наверх | Cообщить модератору |
82. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 14:20 | ||
Там до переписывания и до того что можно было бы назвать движком еще очень далеко. | ||
Ответить | Правка | ^ к родителю #77 | Наверх | Cообщить модератору |
91. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 14:58 | ||
У мозиллы слишком отличается направление движения - "всё упростить, ориентировать на массового пользователя, всё засунуть в веб или хотя бы в джаваскрипт". Тут на чём не пиши - всё равно гадость будет. | ||
Ответить | Правка | ^ к родителю #77 | Наверх | Cообщить модератору |
97. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от rob pike on 14-Июл-16, 15:37 | ||
Самое смешное, конечно, в том что она будет еще и никому не нужная, потому что Chrome уже есть, и перехромить его не удастся. | ||
Ответить | Правка | ^ к родителю #91 | Наверх | Cообщить модератору |
144. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 15-Июл-16, 00:03 | ||
Вот то, что до них это не доходит, меня удивляет больше всего. | ||
Ответить | Правка | ^ к родителю #97 | Наверх | Cообщить модератору |
150. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 15-Июл-16, 09:37 | ||
А в других случаях - с Blackberry, например - не удивляет? Это обыденность, редки наоборот, исключения из этого паттерна - такие как Harley Davidson, например. | ||
Ответить | Правка | ^ к родителю #144 | Наверх | Cообщить модератору |
162. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 21:29 | ||
> На хабре (https://habrahabr.ru/post/277031) я описывал что за проект и к чему стремлюсь. | ||
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору |
4. "Первый релиз многопоточного HTML-парсера MyHTML" | +8 +/– | |
Сообщение от rob pike on 13-Июл-16, 20:24 | ||
Сравнение с парсером на Rust - http://lexborisov.github.io/benchmark-html-persers/ | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
6. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от freehck (ok) on 13-Июл-16, 20:52 | ||
Ух. Да оно на порядок опережает servo/html5ever. Очень, очень достойный результат. | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
7. "Первый релиз многопоточного HTML-парсера MyHTML" | +16 +/– | |
Сообщение от rob pike on 13-Июл-16, 21:20 | ||
Это какая ошибка, ведь Rust самый лучший язык, у servo самые лучшие разработчики на самом лучшем языке, Mozilla Foundation самая прогрессивная опен-сорс компания, а поезд Си давно ушел! | ||
Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору |
100. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 15:43 | ||
Как уже упоминал тёзка, html5ever скорее заглушка, которая ещё будет пилиться. Ну и gumbo тоже, как бы, на Си написан. | ||
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору |
102. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 16:37 | ||
Но ведь скорость разработки на прогрессивном языке Rust обгоняет фотоны в вакууме! | ||
Ответить | Правка | ^ к родителю #100 | Наверх | Cообщить модератору |
108. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 18:00 | ||
> Но ведь скорость разработки на прогрессивном языке Rust обгоняет фотоны в вакууме! | ||
Ответить | Правка | ^ к родителю #102 | Наверх | Cообщить модератору |
129. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 21:35 | ||
> Казалось бы, причем тут скорость разработки. | ||
Ответить | Правка | ^ к родителю #108 | Наверх | Cообщить модератору |
139. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 22:52 | ||
| ||
Ответить | Правка | ^ к родителю #129 | Наверх | Cообщить модератору |
163. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 22:19 | ||
> Это какая ошибка, ведь Rust самый лучший язык, у servo самые лучшие | ||
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору |
19. "Первый релиз многопоточного HTML-парсера MyHTML" | –5 +/– | |
Сообщение от angra (ok) on 13-Июл-16, 22:58 | ||
Мсье точно смотрел графики? В каком месте на порядок? Или кто-то не знает, что порядок это в 10 раз, а не на 10%? | ||
Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору |
21. "Первый релиз многопоточного HTML-парсера MyHTML" | +3 +/– | |
Сообщение от rob pike on 13-Июл-16, 23:01 | ||
> MyHTML Overall time: 0.50890 | ||
Ответить | Правка | ^ к родителю #19 | Наверх | Cообщить модератору |
22. "Первый релиз многопоточного HTML-парсера MyHTML" | –2 +/– | |
Сообщение от angra (ok) on 13-Июл-16, 23:11 | ||
Ну как и предполагалось, графиков не смотрели, просто глянули на итоговые цифры. | ||
Ответить | Правка | ^ к родителю #21 | Наверх | Cообщить модератору |
24. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 01:05 | ||
Может быть вы расшифруете свою мысль, снизойдете до пояснений? | ||
Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору |
51. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от angra (ok) on 14-Июл-16, 11:06 | ||
В большей части случаев разница не в 10 раз, а от двух до четырех. То есть финальная разница в 10 раз сделана небольшим количеством сайтов. Причем очень любопытно, что на какой-нибудь паре сайтов сабж справляется за почти одинаковое время, а html5ever с разницей в три раза. Тут два варианта, либо есть проблемы с парсингом каких-то конструкций в html5ever, либо сабж просто скипает парсинг некорректных кусков. И в этом серьезная проблема всего бенчмарка, он сравнивает скорость парсинга, но не проверяет корректность или хотябы равенство результатов у парсеров. | ||
Ответить | Правка | ^ к родителю #24 | Наверх | Cообщить модератору |
55. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от lastmac on 14-Июл-16, 12:14 | ||
Сравниваются только полноценные парсеры. То есть те кто полностью соответствует спецификации и проходит тесты на правильное построение дерева https://github.com/html5lib/html5lib-tests/tree/master/tree-... | ||
Ответить | Правка | ^ к родителю #51 | Наверх | Cообщить модератору |
104. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от angra (ok) on 14-Июл-16, 17:12 | ||
Еще раз, сравнивались ли деревья, построенные парсерами на этих 60к сайтов, многие из которых скорее всего не полностью следуют спецификациям? Насколько сильно оставание на этих эталонных тестах, а не реальных сайтах? | ||
Ответить | Правка | ^ к родителю #55 | Наверх | Cообщить модератору |
115. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 18:38 | ||
Чуть ниже по треду есть же ответ: http://www.opennet.dev/openforum/vsluhforumID3/108541.html#45 | ||
Ответить | Правка | ^ к родителю #104 | Наверх | Cообщить модератору |
122. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от angra (ok) on 14-Июл-16, 19:08 | ||
Это не ответ на мой вопрос. Ну разве что считать это признанием в том, что на самом деле бенч был несколько некорректным. | ||
Ответить | Правка | ^ к родителю #115 | Наверх | Cообщить модератору |
125. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 14-Июл-16, 19:47 | ||
Быть может вы удивитесь, но их нельзя сравнить по конечной серелизации данных. Всё крайне просто, спецификация "живая" и она постоянно меняется. Вот например, тег isindex выкинули из спецификации не так давно. Теперь такого тега нет, теперь он такой же как прочие "безымянные теги", вроде <mynametag>. Поменялась обработка тега menu and menuitem и т.д.. | ||
Ответить | Правка | ^ к родителю #122 | Наверх | Cообщить модератору |
126. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от angra (ok) on 14-Июл-16, 21:17 | ||
Я веду речь о том, что нельзя сравнивать напрямую скорость, если результат выдается неодинаковый. Тем более непонятно, почему при наличии тестов они не были использованы для бенчмарка. А если были, то интересен результат. | ||
Ответить | Правка | ^ к родителю #125 | Наверх | Cообщить модератору |
130. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от lastmac on 14-Июл-16, 21:38 | ||
Каждый тест парсится меньше чем за 1мс (0.00001). Там нечего тестировать на скорость, это тесты на корректность. | ||
Ответить | Правка | ^ к родителю #126 | Наверх | Cообщить модератору |
138. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от angra (ok) on 14-Июл-16, 22:32 | ||
> Каждый тест парсится меньше чем за 1мс (0.00001). Там нечего тестировать на | ||
Ответить | Правка | ^ к родителю #130 | Наверх | Cообщить модератору |
10. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от ZloySergant (ok) on 13-Июл-16, 21:35 | ||
>Сравнение с парсером на Rust - http://lexborisov.github.io/benchmark-html-persers/ | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
15. "Первый релиз многопоточного HTML-парсера MyHTML" | +7 +/– | |
Сообщение от Аноним (??) on 13-Июл-16, 22:28 | ||
Не ругай меня, родная, что накодил тут г..на я :D | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
20. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 13-Июл-16, 22:59 | ||
> на я :D | ||
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору |
107. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 17:28 | ||
То что ты наблюдал в кабинете информатики своего ПТУ это конечно важные наблюдения, но реальность "немножко" другая. Стыдно не знать что к питону подключаются всякие сишные библиотечки, совмещая скорость Си и простоту питона. К примеру есть вполне себе массовый и шустрый питоновский парсер grab, который написан вокруг обвязки сишной библиотеки lxml. Работает и шустро и просто. Больно, да? | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
153. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Mail on 15-Июл-16, 11:19 | ||
На perl обвязка еще быстрее. | ||
Ответить | Правка | ^ к родителю #107 | Наверх | Cообщить модератору |
155. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 11:46 | ||
> На perl обвязка еще быстрее. | ||
Ответить | Правка | ^ к родителю #153 | Наверх | Cообщить модератору |
166. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от ZloySergant (ok) on 06-Авг-16, 20:08 | ||
> То что ты наблюдал в кабинете информатики своего ПТУ это конечно важные | ||
Ответить | Правка | ^ к родителю #107 | Наверх | Cообщить модератору |
11. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Аноним (??) on 13-Июл-16, 21:54 | ||
> x86_64-apple-darwin15.3.0 | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
23. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от НяшМяш (ok) on 14-Июл-16, 00:01 | ||
Полезнее было бы вместо очередного коммента про проявление отсутствия интереса выложить свои тесты. Пусть даже если эти тесты были сделаны на твоей любимой десяточке. | ||
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору |
48. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от lastmac on 14-Июл-16, 10:51 | ||
> Полезнее было бы вместо очередного коммента про проявление отсутствия интереса выложить | ||
Ответить | Правка | ^ к родителю #23 | Наверх | Cообщить модератору |
63. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 13:04 | ||
html5ever в нынешнем виде не предназначен для использования в продакшне. Это по сути заглушка для прохождения тестов, которая позже будет полностью переписана. Все делающие выводы из этого сравнения, извините за мой французский, некомпетентные идиоты. | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
121. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от lastmac on 14-Июл-16, 19:02 | ||
Не нужно ругаться. Откуда у вас эта информация? | ||
Ответить | Правка | ^ к родителю #63 | Наверх | Cообщить модератору |
8. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Гость (??) on 13-Июл-16, 21:31 | ||
>Код написан на языке Си | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
12. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 13-Июл-16, 22:01 | ||
Количество не найденных ещё дырок всегда бесконечно (цэ). | ||
Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору |
13. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 13-Июл-16, 22:13 | ||
А всё почему? Потому, что ошибка неисчерпаема, как атом. | ||
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору |
25. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 01:06 | ||
Как Electron. | ||
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору |
9. "Первый релиз многопоточного HTML-парсера MyHTML" | –2 +/– | |
Сообщение от Пользователь Debian on 13-Июл-16, 21:33 | ||
Ну, вообще-то реальный веб это не HTML5. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
31. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 08:37 | ||
Это веб пятилетней давности. Сейчас - либо HTML5, либо что-то, где идеальная отрисовка на фиг не нужна. | ||
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору |
45. "Первый релиз многопоточного HTML-парсера MyHTML" | +3 +/– | |
Сообщение от lastmac on 14-Июл-16, 10:44 | ||
> Ну, вообще-то реальный веб это не HTML5. | ||
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору |
59. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 12:35 | ||
> Не испытывает проблем если на вход подать бинарный файл или невалидный HTML; | ||
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору |
27. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 06:05 | ||
Ждём новостей об уязвимостях. Хотя постойте.. нет, никто это не будет использовать. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
65. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:10 | ||
Уже используют. | ||
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору |
28. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 06:55 | ||
Замечательно. Правда, я схему парсинга скрипта неосилил, поэтому вопрос: если в javascript-строке попадется </script> он будет считаться закрывающим тэгом как у всех или нет? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
46. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от lastmac on 14-Июл-16, 10:48 | ||
> Замечательно. Правда, я схему парсинга скрипта неосилил, поэтому вопрос: если в javascript-строке | ||
Ответить | Правка | ^ к родителю #28 | Наверх | Cообщить модератору |
29. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 07:02 | ||
html5ever собирался с флагом --release? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
44. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 14-Июл-16, 10:40 | ||
> html5ever собирался с флагом --release? | ||
Ответить | Правка | ^ к родителю #29 | Наверх | Cообщить модератору |
30. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 08:34 | ||
А как в тестах проверялась корректность результатов? Т.е. что полученный вариант дерева во всех 4-х тестах на выходе совпадает. А то можно написать самый быстрый парсер, который будет выдавать на выходе полную ерунду. но быстро | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
32. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 08:38 | ||
Хм, лично меня (в разумных пределах) скорость не очень волнует. Но вот если разработчику будет, в отличие от хромозилл, не плевать на мнение пользователей - это будет основной фичей. Начиная, скажем, от изначальной разработки с учётом возможности эффективно резать/править контент (адблокеры и прочее) и заканчивая удобным контролем из внешнего софта. Или, допустим, возможность подгрузки сишных плагинов, имеющих те же возможности, что и родные компоненты. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
33. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 08:45 | ||
расшифруй что значит не плевать на пользователей милок, с чего ты взял что если к твоему мнению не прислушались - то значит плюют на пользователей? | ||
Ответить | Правка | ^ к родителю #32 | Наверх | Cообщить модератору |
36. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 08:56 | ||
Да. именно это и значит. Примеры я перечислял. А ещё есть многолетние баги, зато какой-нибудь покет запихнуть - это пожалуйста. | ||
Ответить | Правка | ^ к родителю #33 | Наверх | Cообщить модератору |
39. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 09:53 | ||
а с чего ты взял что ты это все? в твоем приложении используется множественное число, но текст говорит что проблема специфична для тебя. | ||
Ответить | Правка | ^ к родителю #36 | Наверх | Cообщить модератору |
40. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 10:12 | ||
Ну вот я так считаю, что проблема не специфична только для меня. На основании того, что вижу кругом, в том числе здесь на опеннете - можете глянуть на любую новость о мозилле, например. | ||
Ответить | Правка | ^ к родителю #39 | Наверх | Cообщить модератору |
71. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:29 | ||
Если разработчику будет не плевать на мнение пользователей - то шансов как раз нет, потому что толпу пользователей, желающих Chrome, но с перламутровыми пуговицами, вы никогда не перекричите. | ||
Ответить | Правка | ^ к родителю #40 | Наверх | Cообщить модератору |
74. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 13:45 | ||
Поэтому им надо давать возможность пришить эти самые пуговицы. Как было в мозилле, только круче - чтобы можно было влезть в сами движки. | ||
Ответить | Правка | ^ к родителю #71 | Наверх | Cообщить модератору |
75. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 13:49 | ||
так вам дали эту возможность. Открыли код. А что за вас еще и пришить должны? | ||
Ответить | Правка | ^ к родителю #74 | Наверх | Cообщить модератору |
95. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 15:21 | ||
Во-первых, там что открыли, что нет - сложность кода такая, что если нет специализированного API игра не стоит свеч - хоть сам делай, хоть кого-то нанимай, больно дорого. На то, чтобы въехать в код там месяц фуллтайм нужен примерно. | ||
Ответить | Правка | ^ к родителю #75 | Наверх | Cообщить модератору |
148. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 08:00 | ||
> Во-первых, там что открыли, что нет - сложность кода такая, что если | ||
Ответить | Правка | ^ к родителю #95 | Наверх | Cообщить модератору |
83. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 14:22 | ||
Вы не помните сколько из-за XUL в мозилле было проблем? | ||
Ответить | Правка | ^ к родителю #74 | Наверх | Cообщить модератору |
92. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 15:08 | ||
Я как раз с ним проблем не припомню. кроме, разве что, тормозности - дык это от того, что они его адово переусложнили и зачем-то прибили к джаваскрипту. А по нынешним временам можно вообще Qt брать и не париться. | ||
Ответить | Правка | ^ к родителю #83 | Наверх | Cообщить модератору |
98. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 15:38 | ||
> кроме, разве что, тормозности - дык это от того, что они его адово переусложнили | ||
Ответить | Правка | ^ к родителю #92 | Наверх | Cообщить модератору |
113. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 18:34 | ||
Особых противоречий нет. | ||
Ответить | Правка | ^ к родителю #98 | Наверх | Cообщить модератору |
131. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 21:46 | ||
> Особых противоречий нет. | ||
Ответить | Правка | ^ к родителю #113 | Наверх | Cообщить модератору |
145. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 15-Июл-16, 00:12 | ||
Я на файрфоксе сидел с тех времён, когда он назывался firebird - с оперой вперемешку. Во всяком случае оно было достаточно юзабельным, чтобы не уходить. | ||
Ответить | Правка | ^ к родителю #131 | Наверх | Cообщить модератору |
151. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 15-Июл-16, 10:10 | ||
> Во всяком случае оно было достаточно юзабельным, чтобы не уходить. | ||
Ответить | Правка | ^ к родителю #145 | Наверх | Cообщить модератору |
61. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 12:38 | ||
А с чего ты взял что проблема специфична только для него? Ты пробовал писать багрепорты авторам? Или думаешь он единственный кто пробовал? | ||
Ответить | Правка | ^ к родителю #39 | Наверх | Cообщить модератору |
76. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 13:50 | ||
> А с чего ты взял что проблема специфична только для него? Ты | ||
Ответить | Правка | ^ к родителю #61 | Наверх | Cообщить модератору |
35. "Первый релиз многопоточного HTML-парсера MyHTML" | +2 +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 08:51 | ||
Кстати - куда донейты слать? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
43. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 14-Июл-16, 10:38 | ||
Хороший вопрос. Я им не задавался и даже не знаю как это организовывается. Вот пару месяцев назад мне предлагали биткоинов, но я как-то застеснялся и отказался. Да и они незаконны у нас, вроде. | ||
Ответить | Правка | ^ к родителю #35 | Наверх | Cообщить модератору |
58. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Crazy Alex (ok) on 14-Июл-16, 12:33 | ||
У вас - это в России? Насколько я понимаю, не то чтобы незаконны, скорее власти пока сами решить не могут, как к ним относиться. Но счёт в палке (и соответствующая кнопка Donate) точно возможны. | ||
Ответить | Правка | ^ к родителю #43 | Наверх | Cообщить модератору |
38. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 09:39 | ||
Ждем выход браузера на этом деле. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
53. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 12:09 | ||
Вот это проектик... Автор молодец! | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
66. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 13:12 | ||
SIMD-инструкции используются в довольно небольшой части парсинга, такой как проматывание до искомого символа, например. | ||
Ответить | Правка | ^ к родителю #53 | Наверх | Cообщить модератору |
70. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 13:27 | ||
Интерестно, а можно будет потом этот "браузер" (парсер+рендерер) портануть на ARM11 для Symbian 9.x с помощью P.I.P.S.? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
78. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Kodir (ok) on 14-Июл-16, 14:02 | ||
Стотыщный парсер протухшего HTML - оно надо? Гипертекст ущербен изначально, его основной смысл был в простейшем форматировании + ссылки (типа как сейчас markdown). Но совр. сайты и принципы дизайна ушли намного дальше даже полиграфии, поэтому без нового языка веб тихо деградирует и наполняется разной говённости сайтегами, где дизайнер тратит уйму времени на элементарные вещи. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
86. "Первый релиз многопоточного HTML-парсера MyHTML" | +3 +/– | |
Сообщение от тоже Аноним (ok) on 14-Июл-16, 14:27 | ||
Ну, молодой человек, раз уж вы сами вышли к доске, расскажите нам о внутреннем формате AI. | ||
Ответить | Правка | ^ к родителю #78 | Наверх | Cообщить модератору |
109. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 18:03 | ||
В старых версиях -- PostScript, в новых -- PDF. | ||
Ответить | Правка | ^ к родителю #86 | Наверх | Cообщить модератору |
111. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от тоже Аноним (ok) on 14-Июл-16, 18:20 | ||
Ну вот! А я-то и не подозревал. | ||
Ответить | Правка | ^ к родителю #109 | Наверх | Cообщить модератору |
132. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 21:49 | ||
Переписать React на PostScript - я хотел бы на это посмотреть! | ||
Ответить | Правка | ^ к родителю #111 | Наверх | Cообщить модератору |
79. "Первый релиз многопоточного HTML-парсера MyHTML" | +1 +/– | |
Сообщение от dq0s4y71 (??) on 14-Июл-16, 14:10 | ||
А зачем нужно парсер HTML делать многопоточным? По-моему, даже у компиляторов промышленного уровня парсеры не делают многопоточными, потому что основное время тратится совсем не на парсинг. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
84. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 14:24 | ||
Затем что быстрый парсер нужен далеко не только компиляторам. | ||
Ответить | Правка | ^ к родителю #79 | Наверх | Cообщить модератору |
93. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от dq0s4y71 (??) on 14-Июл-16, 15:14 | ||
Прирост в скорости разбора среднестатистической веб-страницы будет практически незаметен, зато сложность и ресурсоёмкость многопоточного парсера будет ощутимо выше. | ||
Ответить | Правка | ^ к родителю #84 | Наверх | Cообщить модератору |
99. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 15:40 | ||
Кому он будет незаметен? | ||
Ответить | Правка | ^ к родителю #93 | Наверх | Cообщить модератору |
101. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от dq0s4y71 (??) on 14-Июл-16, 16:16 | ||
В этом случае да, согласен. | ||
Ответить | Правка | ^ к родителю #99 | Наверх | Cообщить модератору |
94. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от dq0s4y71 (??) on 14-Июл-16, 15:16 | ||
И, кстати, именно поэтому в GCC, в конце концов, отказались от bison и переписали парсер вручную. | ||
Ответить | Правка | ^ к родителю #84 | Наверх | Cообщить модератору |
81. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от dq0s4y71 (??) on 14-Июл-16, 14:19 | ||
> Поддерживает C99; | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
103. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 14-Июл-16, 16:48 | ||
Нет, но глаз радует! :) | ||
Ответить | Правка | ^ к родителю #81 | Наверх | Cообщить модератору |
140. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 22:53 | ||
Вот будете в прошлое путешествовать, сразу поймёте. | ||
Ответить | Правка | ^ к родителю #103 | Наверх | Cообщить модератору |
158. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от dq0s4y71 (??) on 15-Июл-16, 12:59 | ||
Тогда надо было написать "поддерживает ООП" или что-нибудь "визуальное". Школота это понимает. | ||
Ответить | Правка | ^ к родителю #103 | Наверх | Cообщить модератору |
85. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Антоним (ok) on 14-Июл-16, 14:26 | ||
Жду не дождусь нативного браузера под андроид. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
87. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 14:35 | ||
> К примеру, запретил document.write | ||
Ответить | Правка | ^ к родителю #85 | Наверх | Cообщить модератору |
106. "Первый релиз многопоточного HTML-парсера MyHTML" | –1 +/– | |
Сообщение от Дуплик (ok) on 14-Июл-16, 17:25 | ||
Спасибо, отличный софт! | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
123. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 14-Июл-16, 19:28 | ||
Всегда рад помочь! | ||
Ответить | Правка | ^ к родителю #106 | Наверх | Cообщить модератору |
120. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от KR on 14-Июл-16, 18:54 | ||
Неужели я вижу что-то, написанное не на новеньком модном Go/Rust/etc.? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
133. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 21:51 | ||
На страницы таблоидов еще изредка попадает что-то написанное на Scala, но всё реже. | ||
Ответить | Правка | ^ к родителю #120 | Наверх | Cообщить модератору |
135. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от rob pike on 14-Июл-16, 21:55 | ||
> While I've never used html5ever it's landing page mentions that the DOM representation is pluggable (and suggests that the DOM included is mostly for demonstration purposes). Based on your benchmark repo it seems you're using a very simple C lib api wrapper around html5ever that indeed uses the proof-of-concept DOM. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
137. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 14-Июл-16, 22:13 | ||
Читал. Странный комментарий. Автор предполагает и он не прав. | ||
Ответить | Правка | ^ к родителю #135 | Наверх | Cообщить модератору |
142. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 14-Июл-16, 23:51 | ||
Прекрасный проект, спасибо вам. Попробую написать обвязочку для luajit | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
146. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 15-Июл-16, 05:35 | ||
Вам спасибо! Для вас делаю. | ||
Ответить | Правка | ^ к родителю #142 | Наверх | Cообщить модератору |
152. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Аноним (??) on 15-Июл-16, 10:58 | ||
Джва года ждал. Когда уже запилят браузер? Я недавно видел принципиально новый пармер javascript на Си. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
154. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 15-Июл-16, 11:45 | ||
Дело это не простое, но реализуемое. По прогнозам сложно что-то сказать. Могу сказать одно, что это дело не двух недель и даже не двух месяцев. | ||
Ответить | Правка | ^ к родителю #152 | Наверх | Cообщить модератору |
156. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Vsevolod Stakhov on 15-Июл-16, 12:02 | ||
http://duktape.org/ | ||
Ответить | Правка | ^ к родителю #154 | Наверх | Cообщить модератору |
157. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от Vsevolod Stakhov on 15-Июл-16, 12:07 | ||
Очень интересный набор фич и производительность, спасибо за работу! | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
159. "Первый релиз многопоточного HTML-парсера MyHTML" | +/– | |
Сообщение от lastmac on 15-Июл-16, 18:13 | ||
Спасибо! | ||
Ответить | Правка | ^ к родителю #157 | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |