Извлечение содержимого из URL-адреса Unicode

#php

#php

Вопрос:

Я хотел бы извлечь содержимое (HTML) из этого URL : http://www.tvsporedi.si/spored.php?id=Vaš kanal . Я пробовал использовать File_Get_Contents и cURL.

Независимо от того, как я создаю URL-адрес в своем коде, страница всегда возвращает пустую страницу (страницу с заголовком и меню, но без содержимого). Я попробовал URL-кодирование параметра id, оставив идентификатор таким, какой он есть, без какой-либо удачи. Единственное изменение, которое я могу внести в URL (кажется), — это кодирование пробела (с помощью . Кодирование š не работает.

Итак, я думаю, я спрашиваю, почему PHP «съедает» š ? Файл PHP сохраняется в кодировке UTF-8 …

Комментарии:

1. @Gordon wired, я получаю таблицу с некоторыми данными в ней, попробуйте щелкнуть по какой-либо ссылке в меню навигации, чтобы увидеть пример того, что вы должны видеть.

2. К вашему сведению, вы можете запросить объединение своих учетных записей. Посмотрите, как можно связать / объединить / объединить / связать две учетные записи / пользователей? (Анонимный / незарегистрированный / cookie или OpenID / зарегистрированный)

3. Приветствия, Роб! Не знал этого 🙂

Ответ №1:

Попробуйте извлечь:

http://www.tvsporedi.si/spored.php?id=Vaš kanal

Это работает для меня в браузере, и я бы предположил, каким бы методом вы ни пользовались.

Я использовал Firebug, чтобы посмотреть, как браузер кодирует запрос…

Комментарии:

1. Ха, это чертовски странно, сейчас это работает, но раньше этого не было… ну, в любом случае, спасибо 🙂 Я приму ваш ответ, как только это позволит мне 🙂

Ответ №2:

работает для меня с urlencode :

 readfile('http://www.tvsporedi.si/spored.php?id=' . urlencode('Vaš kanal'));
 

ДЕМОНСТРАЦИЯ