Бих искал да изтегля данни, отнасящи се до ключови думи направо в/от R. Разбирам, че RCurl най-вероятно би бил правилният начин, но не съм сигурен как да продължа със задачата. Може би някой тук може да ме насочи на правия път?
PS. Може леко да редактирам този въпрос, докато отговорите се изсипват, защото имам някои идеи как бих могъл да изтегля данни от Adwords с помощта на R; идеите обаче са неясни и всякакви отговори вероятно биха ги направили по-ясни.
Много благодаря.
РЕДАКТИРАНЕ: Моят опит
Следното е, което опитах до сега.
1. приложете getURL
към URL адреса за вход, за да идентифицирате ids
на полетата Имейл и Парола
require(RCurl)
loginURL<- "https://accounts.google.com/ServiceLogin?service=adwords"
ch<- getCurlHandle()
curlSetOpt(curl=ch,ssl.verifypeer=FALSE,cainfo=system.file("CurlSSL", "cacert.pem", package = "RCurl"),cookiejar="./cookies.txt",cookiefile="./cookies.txt",verbose=TRUE,header=TRUE,followlocation=TRUE,autoreferer=TRUE)
try1<- getURL(loginURL,curl=ch)
2. Идентифицирах кои са ids
за важните полета (имейл и парола)
<div class="email-div">
<label for="Email"><strong class="email-label">Email</strong></label>
<input type="email" spellcheck="false"
name="Email" id="Email" value=""
>
</div>
<div class="passwd-div">
<label for="Passwd"><strong class="passwd-label">Password</strong></label>
<input type="password" name="Passwd" id="Passwd"
3. След това използвах горните полета, за да приложа функцията postForm
в loginURL
, за да вляза в Google Adwords
params<- list(
"Email"="myemail",
"Passwd"="mypassword",
"GALX"="3b6rR7Jvk30")
loggedIn<- postForm(loginURL,.params=params,curl=ch)
Въпреки това нямам идея как да проверя дали съм влязъл успешно.
Освен това, URL адресът за инструмента за планиране на ключови думи в потребителския интерфейс на Google Adwords е:
https://adwords.google.com/ko/KeywordPlanner/Home?__c=XXXXXXXXXX&__u=XXXXXXXXXX&__o=cues
където c= отразява customer id
, а u= отразява user id
. Това, което мислех да направя, като се има предвид това, беше да вляза с моя браузър, да поставя URL адреса, показан по-горе, в R и след това да се опитам да намеря идентификаторите за полета, които ще бъдат от значение за мен, като например идентификатора за keywords text box
в инструмента за планиране на ключови думи, към който евентуално бих могъл да изпратя ключови думи от R.
Но когато се опитам да приложа getURL
на гореспоменатия уебсайт, не получавам необходимите/очакваните xml tags
или key value pairs
. Вместо:
<html><head><noscript><meta http-equiv="refresh" content="0; URL=https://adwords.google.com/select/interstitial_short_js.html"></noscript></head><body><script type="text/javascript" language="javascript">var jsRedirect = true;var url = "/um/StartNewLogin?dst=/ko/KeywordPlanner/Home?__c%3D7857647860%26__u%3D4575929980%26__o%3Dcues";
if (self.document.location.hash) {url = url + ((url.indexOf('?') == -1)? '?' : '&') + "frag=" + self.document.location.hash.substring(1); }
window.location.assign(url);
</script> </body> </html>
Това ме навежда на мисълта, че вероятно си имам работа с Javascript
или AJAX
тук. И така, как да извлечете данни от Javascript
или AJAX
с помощта на RCurl
и това правилният въпрос ли е да зададете?
Благодаря и извинения за дългата редакция.
RCurl
. Ще търся повече сътрудници и веднага щом се намери решение, ще уведомя тук и може дори да го направя пакет. - person info_seekeR   schedule 06.07.2014