Публикации по теме 'parsing'


Разбор чисел в эликсире
Как и любой современный язык программирования, в Elixir есть встроенные инструменты для выполнения основных задач, таких как анализ чисел из строк. Хотя они встроены и готовы к использованию, полезно понимать лежащие в их основе алгоритмы. В этом посте мы сначала объясним, как преобразовать строки в целые числа в Elixir. Это будет быстро и полезно. После этого мы пойдем прямо в кроличью нору и объясним основные алгоритмы. Это алхимия, которую мы любим. Это может помочь вам реализовать..

Вопросы по теме 'parsing'

Разбор C++ для создания заглушек модульных тестов
Недавно я пытался создать модульные тесты для некоторого устаревшего кода. Я использую подход с помощью компоновщика, чтобы показать мне, какие функции вызывают ошибки ссылок, проверяя источник, чтобы найти определение, и создавая из него заглушку....
4647 просмотров
schedule 25.12.2023

регулярное выражение для разбора html (в С#)
Я пытаюсь проанализировать html-страницу и извлечь 2 значения из строки таблицы. HTML для строки таблицы выглядит следующим образом: - <tr> <td title="Associated temperature in (ºC)" class="TABLEDATACELL" nowrap="nowrap" align="Left"...
12032 просмотров
schedule 04.11.2023

Текстовый синтаксический анализатор Microsoft Word в C
Я хотел бы знать процедуру анализа и получения текстового содержимого из документов Microsoft Word (.doc и .docx). используемый язык программирования должен быть простым "C" (должен быть gcc). Существуют ли какие-либо библиотеки, которые уже...
5218 просмотров
schedule 07.12.2023

Реализовать граничные состояния слов в flex/lex (парсер-генератор)
Я хочу иметь возможность определять совпадения шаблонов в зависимости от того, встречаются ли они после словесных символов или после несловных символов. Другими словами, я хочу смоделировать символ регулярного выражения \b для разрыва слова в начале...
2369 просмотров
schedule 02.10.2022

Как лучше всего анализировать документы Microsoft Office и PDF?
Я разрабатываю поисковую систему для настольных компьютеров, используя VB9 (VS2008) и Lucene.NET. Индексатор в Lucene.NET принимает только необработанные текстовые данные, и невозможно напрямую извлечь необработанный текст из документов Microsoft...
4704 просмотров
schedule 09.12.2022

Как лучше всего написать парсер вручную?
Мы использовали ANTLR для создания парсера для SQL-подобной грамматики, и хотя результаты в большинстве случаев удовлетворительны, есть несколько пограничных случаев, которые нам нужно исправить; и так как мы не писали синтаксический анализатор сами,...
9613 просмотров
schedule 01.02.2024

Лучший алгоритм для вычисления математического выражения?
Какой лучший алгоритм для вычисления математического выражения? Я хотел бы иметь возможность немного оптимизировать это в том смысле, что у меня может быть одна формула с различными переменными, которые мне, возможно, придется оценивать сотни раз с...
6078 просмотров
schedule 16.12.2023

Библиотека анализатора SQL для Java [закрыта]
Существует ли библиотека Java с открытым исходным кодом для анализа операторов SQL? Если возможно, он должен быть настраиваемым или достаточно гибким, чтобы также иметь возможность анализировать (или, по крайней мере, игнорировать) специфичный для...
99767 просмотров
schedule 27.02.2024

Как сохранить пробел перед элементом документа при анализе с помощью Java?
В своем приложении я изменяю часть файлов XML, которые начинаются так: <?xml version="1.0" encoding="UTF-8"?> <!-- $Id: version control yadda-yadda $ --> <myElement> ... Обратите внимание на пустую строку перед...
4884 просмотров
schedule 23.04.2024

Создание парсера Fortran 77 из грамматики yacc с использованием Happy (Haskell)
Я наткнулся на следующую грамматику yacc F77: http://yaxx.cvs.sourceforge.net/viewvc/yaxx/yaxx/fortran/fortran.y?revision=1.3&view=markup . Как мне сделать парсер Fortran 77 из этого файла, используя Happy ? Почему там какой-то C?/C++? код в...
2239 просмотров
schedule 26.09.2022

Разбор строки в строке?
У меня есть функция, которая принимает строковый параметр, такой как: "var1=val1 var2=val2 var3='список значений'"; Мне нужно проанализировать эту строку и выбрать комбинацию var/val. Это достаточно просто, пока не будет введено что-то вроде...
1003 просмотров
schedule 12.05.2024

Разбор XML с помощью PHP
У меня постоянно возникали проблемы с разбором XML с помощью PHP, и я не нашел «правильного пути» или, по крайней мере, стандартизированного способа анализа XML-файлов. Сначала я пытаюсь разобрать это: <item>...
13875 просмотров
schedule 22.02.2024

Можно ли проверить синтаксис файла PHP из PHP?
Я динамически загружаю файлы классов PHP с автозагрузкой. И эти файлы могут быть потеряны или повреждены по какой-либо причине. Автозагрузка успешно сообщит об отсутствующих файлах, чтобы логика приложения могла справиться с этим. Но если эти...
6018 просмотров
schedule 16.05.2024

Анализировать и запрашивать SOAP в C#
Я пытаюсь разобрать сообщение SOAP с большим количеством имен (источник также можно найти здесь ): <?xml version="1.0" encoding="UTF-8"?> <soapenv:Envelope xmlns:soapenv="http://schemas.xmlsoap.org/soap/envelope/"...
4697 просмотров
schedule 28.12.2023

Пример перегрузки оператора извлечения C++ ›› для разбора данных
Я ищу хороший пример того, как перегрузить оператор ввода потока (operator>>) для анализа некоторых данных с помощью простого форматирования текста. Я прочитал это руководство , но хотел бы сделать что-то более продвинутое. В моем случае у меня...
4027 просмотров
schedule 24.03.2024

Загрузить данные в табличное представление из Parsed XML
Раньше у меня были сомнения относительно Parsing XML. Спасибо всем за помощь, чтобы очистить это. Теперь мне нужно загрузить данные, которые я проанализировал из XML, в табличное представление. может ли кто-нибудь помочь мне в этом. [Что мне...
1390 просмотров
schedule 18.05.2024

Правила синтаксического анализа — как заставить их хорошо сочетаться друг с другом
Итак, я делаю синтаксический анализатор, где я предпочитаю гибкость скорости, и я хочу, чтобы было легко писать грамматики, например. никаких хитрых правил обхода (поддельные правила для разрешения конфликтов и т. д., как вы должны делать в...
794 просмотров
schedule 27.11.2023

Создание своего рода компонуемого парсера для лог-файлов
Я начал небольшой проект по анализу файлов журнала для Team Fortress 2. В файлах журнала есть событие в каждой строке, например следующее: L 10/23/2009 - 21:03:43: "Mmm... Cycles!<67><STEAM_0:1:4779289><Red>" killed...
166 просмотров
schedule 16.02.2024

Самый простой способ получить все содержимое href на странице в Ruby?
Я пишу простой поисковый робот на Ruby, и мне нужно получить все href содержимое страницы. Каков наилучший способ сделать это или любой другой анализ исходного кода веб-страницы, поскольку некоторые страницы могут быть недействительными, но я все...
394 просмотров
schedule 11.11.2022

Найти следующий тег с помощью pyparsing
Я использую pyparsing для анализа HTML. Я беру все теги embed , но в некоторых случаях непосредственно следует тег a , за которым я также хочу захватить, если он доступен. пример: import pyparsing target = pyparsing.makeHTMLTags("embed")[0]...
1792 просмотров
schedule 25.11.2023