Celem tego ćwiczenia jest próba nawiązywania połączeń w sieci Internet, i przeszukiwania stron HTML przy użyciu napisanych poprzednio programów. Obecny program powinien:

  1. otworzyć połączenie do serwera WWW o adresie podanym przez użytkownika, i ściągnąć bazowy dokument HTML (o ścieżce /)
  2. z dokumentu usunąć wszystkie znaczniki HTML (wykorzystując program z zadania 3) i w otrzymanym w ten sposób tekście znaleźć wszystkie dopasowania wyrażenia podanego przez użytkownika, i wyświetlić na stdout, lub w okienku, jak w zadaniu 5
  3. następnie znaleźć w pierwotnym dokumencie wszystkie adresy URL, i wyświetlić użytkownikowi ich listę jako menu wyboru
  4. gdy użytkownik wybierze jeden z tych adresów, ściągnąć odpowiadający mu dokument HTML i powtórzyć dopasowanie poszukiwanego wyrażenia, jak punkcie 2

Aby ściągnąć dokument ze zdalnego serwera WWW należy:

  1. Otworzyć połączenie TCP (SOCK_STREAM) do serwera na porcie 80
  2. Wysłać tym połączeniem komunikat "GET / HTTP/1.0" zakończony dwoma znakami NEWLINE. Argument / oznacza ścieżkę do głównej strony serwera, i zamiast tego można podać dowolną ścieżkę do dokumentu na tym serwerze, czyli część adresu URL za adresem IP i numerem portu.
  3. Odczytać wszystkie dane z połączenia. Na początku może znajdować się pewna liczba wierszy nagłówkowych poprzedzających właściwy dokument. Należy je pominąć.
  4. Zdalny serwer zamknie połączenie po wysłaniu wszystkich danych.