Witam! Pracuję nad robotem do pracy mgr, robot parsuje do bazy dane z allegro.pl oraz dostępnych archiwów allegro: archiwumallegro.pl/ i allegro.archiver.pl. Problem pojawia się przy odczycie strony z portalu archiwumallegro.pl/ gdyż wczytuje stronę zupełnie innego przedmiotu (zdarza się że z rosyjskiej aukcji). w czasie debugowania adres webrequesta i webresponse jest poprawny jednak po wczytaniu streamu okazuje się że zawiera co innego.Ponieważ ja korzystam z biblioteki HtmlAgilityPack (u mnie odczyt streamu wygląda inaczej) podaję kod wczytywania stron na pdst msdnowego przykładu żebyście mogli sprawdzić o co chodzi:
private string StringGetWebPage(String uri)
{
const int bufSizeMax = 65536;
const int bufSizeMin = 8192;
StringBuilder sb;
try
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(uri);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream responseStream = response.GetResponseStream();
int length = (int)response.ContentLength;
int bufSize = bufSizeMin;
if (length > bufSize)
bufSize = length > bufSizeMax ? bufSizeMax : length;
byte[] buf = new byte[bufSize];
sb = new StringBuilder(bufSize);
while ((length = responseStream.Read(buf, 0, buf.Length)) != 0)
sb.Append(Encoding.UTF8.GetString(buf, 0, length));
}
catch (Exception ex)
{
sb = new StringBuilder(ex.Message);
}
return sb.ToString();
}
uruchamiając fcję dla strony:
StringGetWebPage("http://archiwumallegro.pl/szukaj/?itemid=116553463");
otrzymamy stringa z zupełnie innej strony, tzn strony z domeny archiwumallegro.pl ale dla zupełnie innego przedmiotu, czy ktoś ma pomysł dlaczego i gdzie jest pies pogrzebany??