Gegevens uitlezen

Status
Niet open voor verdere reacties.

royduin

Gebruiker
Lid geworden
6 mei 2006
Berichten
583
Beste,

ik ben bezig met het uitlezen van verschillende website's, heb hier netjes akkoord voor gekregen. De eerste is geheel gelukt maar de tweede krijg ik de volgende melding:
Code:
Not Found

The requested URL /<html><body><h1>Forbidden</h1>U heeft geen rechten deze pagina op te vragen.</body></html> was not found on this server.

Additionally, a 404 Not Found error was encountered while trying to use an ErrorDocument to handle the request.

Apache/2 Server at *** Port 80

wanneer ik de url tussen file_get_contents (van deze functie maak ik ook gebruik bij een andere website, hier geen probleem) zet.

Wanneer ik de pagina normaal open in mijn browser heb ik wel toegang tot deze website. Ook wanneer ik rechtermuisknop en paginabron weergeven kies krijg ik dit netjes te zien.

Hoe kan dit?

Alvast bedankt!
 
Waarschijnlijk wordt het protocol dat file_get_contents gebruikt niet geaccepteerd.

Je zou het eventueel nog kunnen proberen met cURL?

Misschien dat die wel de juiste data verstuurt om toegang tot de pagina te krijgen.
 
Helaas ook niet. Zijn er nog andere alternatieven?
 
Welke curl code heb je gebruikt? Als je de useragent spooft en net doet of je firefox (of een andere browser) bent heb je kans dat het wel werkt.

(en als je normaal gesproken moet inloggen om de content te bekijken moet je dit ook in je php code verwerken)
 
Gister avond verschillende scripts gebruikt, opgezocht via Google. Geen van allen, omdat het niet werkte weer verwijderd, momenteel dus geen code.
Misschien dat je een klein voorbeeldje heb? Inloggen is tevens niet nodig.
 
PHP:
<?php
	$url = "http://google.com/";
	$useragent="Mozilla/5.0 (Windows; U; Windows NT 6.0; nl; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)"; 
	$kk = curl_init(); 
	curl_setopt($kk, CURLOPT_URL, $url);
	curl_setopt($kk, CURLOPT_USERAGENT, $useragent);
	curl_setopt($kk, CURLOPT_HEADER, 0);
	curl_setopt($kk, CURLOPT_RETURNTRANSFER, true);
	curl_setopt($kk, CURLOPT_TIMEOUT, 10);
	$data = curl_exec($kk);
	curl_close($kk);
	//doe iets met $data
?>
 
Nog een vraagje m.b.t. dit onderwerp;
Hoe krijg ik de output in een array geladen? Bij de andere website die ingeladen wordt gebruik ik "file", deze functie zet het automatisch in een array.

Alvast bedankt!
 
Zat hier gister ook al mee te rommelen dacht dat ik de verkeerde functie gebruikte. Ik ga weer verder proberen.

Bedankt!
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan