не может получить точную кодировку с помощью file_get_html

Я пытаюсь получить информацию с веб-сайта, используя file_get_html простого html dom. Ссылка, которую я пробовал: http://dns.marnet.net.mk/registar.php?dom=test.mk

то, что я получаю, полно вопросительных знаков

������ ������������ ������: 
test.com.mk
test.mk
�������� �� �������: test.mk [ ����� ��:15507 ]
���� �� ���� � ������� ��������������: 24-02-2013
���� �� ������������ �� �������:

24-02-2009
����� ��� �� ������������:

��� ��������� �������-������ ����� ������, ������� �� �����������, ���������, �������� � ������
������ �� ������������:

���. ����� �������� ��. 15/10, ������
��� �� ������������:

4030006605991
�������� �� ������������:

02/3114-001

��������������� �������
���:

����� ���������
e-mail:

[email protected]
�������:

02/3114-000
�������� �������
���:

����� ���������
e-mail:

[email protected]
�������:

02/3114-002
������� �����������
���
IP
ns2.powweb.com  65.254.254.134
ns1.powweb.com  65.254.254.135

Как я могу получить оригинальные символы, используемые на сайте?


person hablema    schedule 04.10.2012    source источник


Ответы (2)


Я узнал решение.

Я добавил это после команды file_get_html.

$html=mb_convert_encoding($html,'utf8','windows-1251');

Это преобразовало мою кодировку по мере необходимости.

Спасибо всем, кто ответил.

person hablema    schedule 04.10.2012

Я только что проверил кодировку на странице при просмотре источника: это дало мне это:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

person Lkrups    schedule 04.10.2012
comment
$html=mb_convert_encoding($html,'utf8','windows-1251'); Это помогло. - person hablema; 04.10.2012