Sende spørsmål til, og skraping resultater fra ASPX sider ved hjelp av python?

stemmer
1

Jeg prøver å få resultater for baking av henvendelser til denne demografi verktøy siden: http://adlab.microsoft.com/Demographics-Prediction/DPUI.aspx

POST handling på skjemaet kaller samme side (_self) og er sannsynligvis innlegg noen hendelsesdata. Jeg leste på et annet innlegg her på Stackoverflow at ASPX sider vanligvis trenger noen Visningsstatusen og validering av data. Må jeg rett og slett redde disse fra en forespørsel, re-sende inn en POST-forespørsel?

Eller er det en renere måte å gjøre dette? En av disse ASPX Visningsstatusen parametrene er ca 1000 tegn og utrolig stygghet av lime den inn i koden min gjør at jeg tror det må være en bedre måte. Enhver og alle referanser til ting jeg kan lese opp vil være nyttig, takk!

Publisert på 13/01/2010 klokken 18:04
kilden bruker
På andre språk...                            


3 svar

stemmer
1

Kanskje mekanisere kan være til nytte.

Svarte 13/01/2010 kl. 18:06
kilden bruker

stemmer
1

Bruk urllib2 . Din POST data er en enkel Python ordbok. Veldig enkelt å redigere og vedlikeholde.

Hvis skjemaet inneholder skjulte felt - hvorav noen er kodet - så må du gjøre en GET for å få skjemaet og de ulike skjulte feltet frøverdier.

Når du får skjemaet, kan du legge de nødvendige inngangsverdier til de gitte, skjulte verdier og legge svaret tilbake igjen.

Også, må du være sikker på at du håndterer informasjonskapsler. urllib2 vil hjelpe med det, også.

Tross alt, det er alt en nettleser gjør det, og det fungerer i en nettleser. Leseren vet ikke ASPX fra CGI fra WSGI, så det er ingen magi fordi det er ASPX. Noen ganger må du gjøre en GET før en POST for å få verdier og cookies satt opp riktig.

Svarte 13/01/2010 kl. 18:29
kilden bruker

stemmer
0

Jeg har brukt en kombinasjon forespørsler og BeautifulSoup4 for en lignende oppgave.

Svarte 27/11/2012 kl. 10:56
kilden bruker

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more