<html>

<body>

<pre>

Apache 1 - bozza versione 0.0

=============================

A coloro che hanno voglia di dare un'occhiata a questo mattone.

Sto preparando anche l'articolo sui protocolli. E' anche piu' lungo.

Fatemi sapere se e' meglio che lascio stare.

- Umb

---------------------------------------------------------------

</pre>

<h1>Apache - Prima puntata</h1>

<h2>Indice</h2>

<a href="#intro">Introduzione</a></br>

<a href="#percominciare">Per cominciare</a><br>

<a href="#hostvirtualibasatisullindirizzoip">Host virtuali basati sull'indirizzo IP</a><br>

<a href="#hostvirtualibasatisulnome">Host virtuali basati sul nome</a><br>

<a href="#cominciamolaconfigurazione">Cominciamo la configurazione</a><br>

<a href="#passo1dichiarareinuovidomini">PASSO 1: Dichiarare i nuovi domini</a><br>

<a href="#passo2predisporreglispaziweb">PASSO 2: Predisporre gli spazi WEB</a><br>

<a href="#passo3configuriamoapache">PASSO 3: Configuriamo Apache</a><br>

<a href="#passo4creiamolehomepage">PASSO 4: Creiamo le home page</a><br>

<a href="#passo5verificadeglihostvirtuali">PASSO 5: Verifica degli host virtuali</a><br>

<a href="#esperimentiinteressanti">Esperimenti interessanti</a><br>

<a href="#webdinamicoeprogrammicgi">WEB dinamico e programmi CGI</a><br>

<a href="#suexecovverodelbracciodestrodeldemonio">SUEXEC - Ovvero del braccio destro del demonio</a><br>

<a href="#scriptaliasdefinirelaledirectorydeicgi">ScriptAlias - Definire la/le directory dei CGI</a><br>

<a href="#scriptaliasmatchunnomeuncgi">ScriptAliasMatch - Un nome, un CGI</a><br>

<a href="#homepagepersonali">Home page personali</a><br>

<a href="#proviamoilsuexec">Proviamo il SUEXEC</a><br>

<a href="#ritocchifinali">Ritocchi finali</a><br>

<a href="#httpdconfintuttalasuagloria"><code>http.conf</code> in tutta la sua gloria</a><br>

<a href="#conclusioni">Conclusioni</a><br>

<a href="#bibliografia">Bibliografia</a><br>

<a name=intro></a>

<h2>Introduzione</h2>

<p>

Apache è un potente WEB server multipiattaforma. Le statistiche

dicono che sia il più utilizzato al mondo, e tutto lascia prevedere

che lo sarà ancora per qualche anno.

</p>

<p>

Apache è disponibile nel sito ufficiale <a

href="http://www.apache.org"><code>www.apache.org</code></a> insieme ai

sorgenti e a tutta la documentazione. Tutte le distribuzioni di Linux

includono il pacchetto Apache, tipicamente già precompilato e

preconfigurato: è sufficiente una installazione base del sistema

operativo, ed anche l'utilizzatore più sprovveduto si ritrova

con un WEB server preinstallato (magari a sua insaputa...).

</p>

<p>

Le cose vanno diversamente quando si desidera configurare Apache per

uso di produzione: diventa allora difficile orientarsi tra la miriade di

opzioni di configurazione di Apache, e la documentazione ufficiale non

aiuta il neofita. In particolare in questo articolo vogliamo configurare

Apache per supportare la multiutenza e raggiungere i seguenti obiettivi:

gestire vari domini WEB; isolare i programmi CGI dei vari siti tra di

loro; dotare gli utenti ciascuno della propria home page.

</p>

<p>

Queste note sono il frutto di alcuni mesi di lavoro passati a spulciare

nella documentazione del programma e a fare prove su varie distribuzioni

Linux, principalmente Red Hat 6.2 e Red Hat 7.1, che includono la

versione 1.3 di Apache. I suggerimenti e le soluzioni che descrivo si

applicano ovviamente anche ad altre distribuzioni, che potranno differire

al più per la scelta dei path di installazione e per il diverso

packaging dei componenti di Apache (modulo base, moduli supplementari,

ecc.).

</p>

<p>

Non ho certo intenzione di scrivere un tutorial di Apache o un ennesimo

manuale. Si tratta semplicemente della descrizione di esperienze

che possono interessare solo gli iniziati che, una volta eseguita con

successo l'installazione base di Apache, desiderano approfondirne alcune

funzionalità avanzate.

</p>

<p>

Non ci inoltreremo qui nelle procedure di ricompilazione del sorgente

del programma, nè faremo altre cose più tediose e

"difficili": ci limiteremo a modifcare il file di configurazione di

Apache ed eventualmente interverremo su qualche altro file di sistema

usando pratiche consuete di configurazione. Riporremo la nostra fiducia

nel rivenditore della distribuzione, che di solito ha cura di rendere

disponibile sul suo sito WEB l'ultima versione di Apache corretta rispetto

ai bug e ai problemi di sicurezza.  Non ci interessa invece di installare

l'ultimissima versione, poiché ci concentreremo sugli aspetti

generali della gestione del server.

</p>

<p>

Ultima annotazione prima di cominciare: teoricamente il <i>system

administrator e il WEB administrator sono due ruoli distinti.

In realtà l'intreccio di competenze è tale che le due figure

finiscono per coincidere. È molto probabile che la configurazione

del WEB server coinvolga parecchi settaggi del sistema, della posta

elettronica, del DBMS, dei permessi e degli utenti, sicchè separare

le due figure diventa davvero difficile. Perciò qui userò

i due termini in modo interscambiabile.

</p>

<a name="percominciare"></a>

<h2>Per cominciare</h2>

<p>

Assicuriamoci innanzitutto che Apache sia installato ed in esecuzione.

È interessante nonché divertente per il sistemista conoscere modi alternativi per fare ciò:

</p>

<b>1. Ordine e disciplina - Seguire la via maestra</b><br>

Linux segue le convenzioni System V per l'inizializzazione del sistema.

Quindi dovrebbe essere disponibile un piccolo script di shell che si incarica

di avviare, fermare e verificare lo stato del server. Lo script esegue una

di queste funzioni a seconda che sia stato invocato con il parametro

<code>start</code>, <code>stop</code> oppure <code>status</code>;

esiste poi anche il parametro <code>restart</code> che ha l'ovvio significato.

Sulla distribuzione Red Hat 6.2 il comando è

</p>

<pre>

        # <b>/etc/rc.d/init.d/httpd status</b>

        httpd (pid 9702 9701 9698) is running...

</pre>

<p>

mentre per la Red Hat 7.1 differisce leggermente il path:

</p>

<pre>

        # <b>/etc/init.d/httpd status</b>

        httpd (pid 9702 9701 9698) is running...

</pre>

<p>

L'output conseguente dovrebbe confortarci che Apache è regolarmente

in esecuzione. Il messaggio esatto dipende da come è stato scritto

questo script, che invito ad andare a vedere.

</p>

<b>2. Il Riduzionista - In Unix è tutta una questione di file e di processi</b><br>

Sappiamo che Unix e Linux sono sistemi operativi concepiti con la filosofia del

meccano: pochi strumenti, ma buoni. File e processi sono il fondamento del sistema, il resto è il sale e il pepe. Il sistemista-riduzionista non si fida

degli script automatici, ma vuole andare alla all'origine delle cose e va a guardare direttamente i processi in esecuzione:

</p>

<pre>

        # <b>ps ax | grep httpd</b>

        9698 ?        S      0:00 /usr/sbin/httpd <i>parametri vari</i>

        9701 ?        S      0:00 /usr/sbin/httpd <i>parametri vari</i>

        9702 ?        S      0:00 /usr/sbin/httpd <i>parametri vari</i>

        9706 pts/2    S      0:00 grep httpd

</pre>

<p>

Il sistemista-riduzionista è previdente: sa che sulla sua

macchina oberata di lavoro sono in esecuzione centinaia di processi,

per cui inserisce un sano <code>grep</code> che seleziona solo le righe

che contengono la stringa <code>httpd</code>. Guardacaso, queste righe

sono proprio quelle relative ai processi di Apache.

</p>

<b>3. L'hacker che c'è in noi - Emerge il lato oscuro</b><br>

Ragioniamo: se un server di rete fornisce servizi in rete, il

modo migliore per verificarne il funzionamento è provare

direttamente questi servizi. Apriamo allora il nostro browser WEB

preferito e puntiamolo sull'URL <code>http://localhost</code>. Il bravo

sistemista/hacker con tendenze riduzioniste usa Telnet come browser WEB:

<p>

<pre>

        # <b>telnet localhost 80</b>

        Trying 127.0.0.1...

        Connected to localhost.localdomain.

        Escape character is '^]'.

        <b>GET / HTTP/1.0</b>  <i>qui premi ENTER due volte</i>

        HTTP/1.1 200 OK

        Date: Mon, 10 Dec 2001 21:50:38 GMT

        Server: Apache/1.3.19 (Unix)  (Red-Hat/Linux)

        Last-Modified: Sat, 11 Aug 2001 19:58:38 GMT

        ETag: "49183-20e-3b758e6e"

        Accept-Ranges: bytes

        Content-Length: 526

        Connection: close

        Content-Type: text/html

        <HTML>

        <i>la pagina HTML che non ci interessa</i>

        </HTML>

        Connection closed by foreign host.

        #

</pre>

<p>

Come al solito, solo il comando evidenziato in grassetto deve essere impartito

a tastiera, il resto sono le risposte del sistema. Notiamo che il comando

<code>GET</code> deve essere scritto proprio in lettere maiuscole, e che

occorre premere due volte il tasto ENTER prima che il server risponda:

la riga vuota è il modo in cui il client (cioè il nostro

Telnet) spiega al server che ha concluso la sua domanda. Infatti, vedremo

che il client ha la possibilità di specificare vari altri parametri

su altrettante righe.

</p>

<p>

Come è facile immaginare, il comando <code>GET</code> serve per

richiedere un documento; a seguire bisogna specificare la parte di path

file dell'URL del documento, essendo per convenzione <code>/</code> la

richiesta della home page, o pagina default, o pagina indice del sito.

Con lungimiranza, il protocollo HTTP richiede anche di specificare

esplicitamente il protocollo e la versione.

</p>

<center>

<table width="70%" border=1 cellpadding=5>

<tr><th bgcolor=#aaaaff>Trucco</th></tr>

<tr><td>Se il terminale che usi non supporta lo scrolling,

sarà difficile riuscire a leggere le prime righe, che sono le

più interessanti. Rimedi possibili: usare <code>script</code>;

richiedere una pagina deliberatamente errata al posto di <code>/</code>,

ad esempio <code>/xxx</code>;

infine, usare un comando come questo:

</p>

<pre>

    # <b>(echo -ne "GET / HTTP/1.0\n\n"; sleep 2)  \</b>

    > <b>| telnet localhost 80 | head -20</b>

</pre>

<p>

In questo modo appariranno solo le prime 20 righe del dialogo con il server,

indipendentemente dalla effettiva lunghezza della risposta. Usando lo stesso

principio si può andare ad esplorare in giro i vari server, e verificare

di persona quali sono i server più usati: interessante, vero?

</p>

</td>

</tr>

</table>

</center>

<p>

A questo punto dovremmo avere la certezza che l'installazione di base di

Apache è a posto. Per ora Apache ritorna la pagina default predefinita

dalla distribuzione, ma questo ci va bene perché stiamo per cambiare

un po' tutto...

</p>

<a name="hostvirtualibasatisullindirizzoip"></a>

<h2>Host virtuali basati sull'indirizzo IP</h2>

<p>

Di base il server Apache risponde ad un unico indirizzo IP e ad

un unico dominio, cioè gestisce un solo sito WEB del tipo

<code>www.azienda.it</code> o una cosa del genere. Gli ISP hanno

invece la necessità di gestire parecchi domini. Le aziende

più avanzate informaticamente sul fronte Internet possono

voler creare siti WEB distinti per le diverse aree funzionali, come

<code>support.azienda.it</code>, oppure desiderano ospitare siti WEB

delle ditte affiliate. Con il protocollo HTTP versione 1.0 era necessario

dotare ogni sito WEB di un indirizzo IP distinto, anche se poi questo

indirizzo si riferiva alla stessa macchina fisica.  In questo consiste

il meccanismo di host virtuale basato sull'indirizzo IP.

</p>

<p>

Le cose funzionavano (e possono funzionare tuttora) così: se un

navigatore cliccava sull'URL <code>www.azienda.it</code>, il browser

risolveva il nome in un certo numero IP <code>11.22.33.44</code>, ed

è a questo server che il browser inviava la richiesta; quando

il navigatore cliccava su <code>support.azienda.it</code>, il browser

risolveva il nome in un indirizzo IP diverso <code>55.66.77.88</code>

al quale rispondeva magari la stessa macchina, ma lì il server

poteva discriminare il sito WEB richiesto in base all'indirizzo IP.

</p>

<a name="hostvirtualibasatisulnome"></a>

<h2>Host virtuali basati sul nome</h2>

<p>

Per ridurre lo spreco di preziosi indirizzi IP, e tutte le inevitabili

complicazioni tecniche, burocratiche e di costi, il protocollo HTTP

versione 1.1 ha aggiunto la funzionalità di host virtuale basato

sul nome.

Il meccanismo è abbastanza semplice: il browser segue la stessa trafila

di prima, ma nella richiesta della pagina specifica anche per esteso il nome

del dominio richiesto. Il server WEB, anche se dotato di un solo indirizzo

IP, ha così modo di riconoscere quale sito WEB tra quelli ospitati

è stato effettivamente richiesto. In questo consiste il meccanismo

di <i>host virtuale basato sul nome</i>. È ovvio che questo sistema

richiede la collaborazione del browser per funzionare. Comunque, tutti i browser

moderni supportano HTTP 1.1, tanto che il meccanismo degli host virtuali

è ampiamente utilizzato. Forse tutto 'sto discorso suona un po'

ingarbugliato, ma vedremo subito degli esempi molto concreti che dovrebbero

chiarire bene come vanno le cose.

</p>

<a name=cominciamolaconfigurazione></a>

<h2>Cominciamo la configurazione</h2>

<p>

Dunque, Apache include il supporto per gli host virtuali basati sul nome

di dominio, previsti dal protocollo HTTP versione 1.1. Questo ci permette

di ospitare sulla nostra macchina un numero arbitrario di siti WEB distinti

utilizzando sempre un solo indirizzo IP. Le specifiche tecniche della

implementazione che andremo a fare sono le seguenti:

</p>

<center>

<table bgcolor="#dddddd" border=1 cellpadding=10>

<tr><th colspan=3>The "Casa" ISP Specs</th></tr>

<tr><td><b>IP Address:</b></td>   <td colspan=2><code>127.0.0.1</code></td></tr>

<tr><td valign=top rowspan=4><b>WEB Sites:</b></td>

<th>Domain</th>  <th>DocumentRoot</th></tr>

<tr><td><code>localhost.localdomain</code></td> <td><code>/home/httpd/html</code></td></tr>

<tr><td><code>www.tizio.casa</code></td> <td><code>/home/tizio/public_html</code></td></tr>

<tr><td><code>www.caio.casa</code></td> <td><code>/home/caio/public_html</code></td></tr>

</tr>

</table>

</center>

<p>

L'indirizzo IP non è scelto a caso: si tratta dell'indirizzo di

loop-back previsto per scopi di test e disponibile su

ogni macchina.  Altro aspetto positivo di questa scelta: non servono

schede di rete e non serve essere connessi ad Internet.

</p>

<a name=passo1dichiarareinuovidomini></a>

<h2>PASSO 1: Dichiarare i nuovi domini</h2>

<p>

Per quanto riguarda i domini gestiti, sono ovviamente nomi di

fantasia che possiamo inserire nell'elenco degli host name del file

<code>/etc/hosts</code>, che andiamo subito a modificare in modo che

appaia cos&igrave:

</p>

<pre>

        127.0.0.1       localhost.localdomain localhost

        <b>127.0.0.1       www.tizio.casa</b>

        <b>127.0.0.1       www.caio.casa</b>

</pre>

<p>

In genere la prima riga è già predisposta, mentre le altre

due sono quelle appena aggiunte. A questo punto i processi che avvieremo

saranno in grado di risolvere i nuovi nomi di dominio.

</p>

<a name=passo2predisporreglispaziweb></a>

<h2>PASSO 2: predisporre gli spazi WEB</h2>

<p>

La strategia che seguiremo comporta la creazione di un normale account

per ciascun dominio gestito. Vogliamo insomma che ogni dominio sia gestibile

da un utente distinto, che vi può accedere in Telnet o FTP come

di consueto. Nella home directory, ciascun utente sarà libero di gestire

il suo sito in totale libertà.<br>

Per creare l'utente Tizio facciamo questo:

</p>

<pre>

        # <b>useradd tizio -g users</b>

        # <b>passwd tizio</b>

        Changing password for user tizio

        New UNIX password: <b>******</b>

        Retype new UNIX password: <b>******</b>

        passwd: all authentication tokens updated successfully

        # <b>chmod u=rwx,g=,o=x  /home/tizio</b>

        # <b>mkdir /home/tizio/public_html</b>

        # <b>chown tizio:users /home/tizio/public_html</b>

        # <b>chmod u=rwx,g=,o=x /home/tizio/public_html</b>

</pre>

<p>

Per i più pigri, spiego a parole quello che abbiamo fatto:

il nuovo utente possiede una normale home directory locata in <code>/home/tizio</code>; dentro a questa directory questo signore potrà lavorare normalmente

come un qualsiasi utente. In più abbiamo creato una sotto-directory

di nome <code>public_html</code> che conterrà la parte pubblica

del sito WEB del sig. Tizio. In altri termini, andremo a configurare Apache

in modo che gli URL del tipo <code>http://www.tizio.casa/x</code> vengano

tradotti nel pathfile <code>/home/tizio/public_html/x</code>.

</p>

<p>

Ci sono però due aspetti molto importanti da considerare:

</p>

<p>

- Abbiamo assegnato esplicitamente il nuovo utente al gruppo

<code>users</code>: questo devia dallo schema generale della distribuzione

Red Hat, che per default crea un nuovo gruppo per ogni utente.

</p>

<p>

- Abbiamo ampliato i diritti di accesso alla home directory

dell'utente con <code>o+x</code> per consentire ad Apache di

attraversarla per raggiungere le pagine WEB dentro a alla subdirectory

<code>public_html</code>. I permessi assegnati sono:

</p>

<center>

<table cellpadding=3 border=1>

<tr><th colspan=9>Permessi di <code>/home/tizio</code></th></tr>

<tr><td colspan=3><center>UID:<br><code>tizio</code></center></td>

<td colspan=3><center>GID:<br><code>users</code></center></td>

<td colspan=3><center>others:</center></td></tr>

<tr>

<td><code>r</code></td>

<td><code>w</code></td>

<td><code>x</code></td>

<td><code>-</code></td>

<td><code>-</code></td>

<td><code>-</code></td>

<td><code>-</code></td>

<td><code>-</code></td>

<td><code>x</code></td>

</tr>

</table>

</center>

<p>

Conviene spendere due parole sul significato di quanto fatto riguardo ai

permessi di accesso, perché l'argomento è un po' delicato,

essendo coinvolti i problemi di sicurezza e riservatezza. Fintanto che

il server WEB è al servizio di un'unica azienda, la separazione degli

spazi di lavoro semplifica la gestione e riduce le interferenze. Tuttavia

se il server deve essere reso disponibile ad altri soggetti sui quali non

si ha pieno controllo, allora le cose vanno studiate più attentamente.

</p>

<p>

Spieghiamo innanzitutto cosa intendiamo con il termine <b>identità

di un processo</b>. Ogni processo ha varie caratteristiche: ad esempio una è il

PID (process identifier), il numero univoco che identifica il processo nel

sistema. Altre due caratteristiche molto importanti sono l'<b>UID</b> e

il <b>GID</b> del processo, cioè il numero dell'utente e il numero

del gruppo che contraddistinguono il processo. Sono questi valori che

il kernel esamina prima di dare il permesso a un processo di accedere ad

una risorsa, come un file o un device. Richiamiamo brevemente i criteri

seguiti dal kernel per decidere se autorizzare o meno una certa operazione

richiesta da un processo su di un file:

</p>

<center>

<table bgcolor=#dddddd width="90%" border=0 cellpadding=10>

<tr><td>

<p>

1. <u>L'UID del processo è uguale all'UID del file.<br></u>

In questo caso si applicano i tre flag dei permessi di utente del file.

Se la combinazione dei flag non permette di eseguire l'operazione richiesta

dal processo (lettura, scrittura, esecuzione), l'operazione viene negata

indipendentemente da tutti gli altri flag di gruppo e others.

</p>

<p>

2. <u>Gli UID del processo e del file differiscono, ma i GID sono uguali</u>.<br>

In tal caso si applicano i tre flag dei permessi di gruppo del file.

Anche qui, se la combinazione dei flag non permette di eseguire l'operazione

richiesta dal processo, l'operazione viene negata

indipendentemente da tutti gli altri flag di others.

</p>

<p>

3. <u>L'UID e il GID del processo non corrispondono a quelli del file</u>.<br>

In tal caso si applicano i tre flag dei permessi di others.

</p>

</td></tr>

</table>

</center>

<p>

Ricordo che Apache gira con l'identità UID:GID = <code>nobody:nobody</code> su Red Hat 6.2, e con l'identità <code>apache:apache</code> su

Red Hat 7.1. Questi parametri vengono impostati nella configurazione

predefinita con le direttive <code>User</code> e <code>Group</code>

nel file di configurazione <code>httpd.conf</code>.

</p>

<p>

La conseguenza di tutto questo discorso è che Apache potrà

entrare nelle directory degli utenti Tizio e Caio grazie al permesso

<code>o+x</code>; inoltre Apache potrà leggere tutti e soli i file

accessibili ad "other". Viceversa, gli altri utenti del sistema, i cui processi

operano con GID = <code>users</code>, si scontrano con il secondo criterio

di validazione, e non possono entrare nella directory.

</p>

<center>

<table width="70%" border=1 cellpadding=5>

<tr>

<th bgcolor=#ffff00>ATTENZIONE!</th>

</tr>

<tr>

<td>

Il modello di sicurezza per i permessi dei file e delle directory

non è l'unico possibile, ma forse è il più semplice

da applicare e da gestire. Lascia tuttavia qualche perplessità

il dover rendere accessibile a "other" la propria home directory.

<p>

Esiste almeno un'altra soluzione che si basa sulla creazione di un gruppo

per ciascun utente, paradigma scelto per default dalla distribuzione

Red Hat. Le home directory degli utenti vanno poi rese attraversabili

dal proprio gruppo. L'utente del server (<code>nobody</code> oppure

<code>apache</code>) deve poi essere inserito nel gruppo di ciascun utente.

Questa, in estrema sintesi la ricetta alternativa.

</td>

</tr>

</table>

</center>

<a name=passo3configuriamoapache></a>

<h2>PASSO 3: Configuriamo Apache</h2>

<p>

E finalmente arriviamo alla configurazione di Apache. Il file di

configurazione è <code>httpd.conf</code>, che nella distribuzione

Red Hat 6.2 e 7.1 si trova in <code>/etc/httpd/conf/httpd.conf</code>.

Raccomando a questo punto di fare una bella copia del file prima che

ci mettiamo su le manacce: è utile avere come riferimento un file

di configurazione che sappiamo essere funzionante.

</p>

<p>

Al termine del file <code>httpd.conf</code> c'è la sezione

destinata agli host virtuali.  Assicuriamoci che sia presente la direttiva

<pre>

         NameVirtualHost 127.0.0.1:80

</pre>

<p>

che attiva la funzionalità degli host virtuali basati sul nome

sulla solita porta 80 del nostro server. Creiamo il virtual host per il

dominio <code>www.tizio.casa</code>:

</p>

<pre>

         <VirtualHost 127.0.0.1:80>

         ServerName <b>www.tizio.casa</b>

         DocumentRoot /home/<b>tizio</b>/public_html

         ServerAdmin <b>tizio</b>@localhost

         CustomLog logs/<b>www.tizio.casa</b>-access_log common

         ErrorLog logs/<b>www.tizio.casa</b>-error_log

         </VirtualHost>

</pre>

<p>

Per gli altri domini virtuali creiamo altrettanti utenti e altre sezioni

VirtualHost similari, facendo attenzione a modificare di conseguenza

il dominio, il path e l'indirizzo di posta, evidenziati in grassetto

nell'esempio. Come ServerAdmin ho indicato in realtà l'utente tizio

invece che il vero WEB administrator: di solito i problemi legati a un

sito WEB sono locali a quel sito (pagine mancanti, CGI non funzionanti,

ecc.)  piuttosto che responsabilità del WEB administrator.

</p>

<a name=passo4creiamolehomepage></a>

<h2>PASSO 4: Creiamo le home page</h2>

Questa è la parte facile e rilassante:

<pre>

        # <b>su - tizio</b>

        $ <b>echo "<html><body><h1>Benvenuti in www.tizio.casa</body></html>"</b>

                      <b>> public_html/index.html</b>

        $ <b>[CTRL-D]</b>

        # <b>su - caio</b>

        $ <b>echo "<html><body><h1>Benvenuti in www.caio.casa</body></html>"</b>

                      <b>> public_html/index.html</b>

        $ <b>[CTRL-D]</b>

</pre>

...e così via per gli altri dominii.

<a name=passo5verificadeglihostvirtuali></a>

<h2>PASSO 5: Verifica degli host virtuali</h2>

<p>

Non ci resta che riavviare Apache. Il comando da dare su Red Hat 6.2 è

</p>

<pre>

        # <b>/etc/rc.d/init.d/httpd restart</b>

</pre>

<p>

mentre su Red Hat 7.1 è

</p>

<pre>

        # <b>/etc/init.d/httpd restart</b>

</pre>

<p>

Se qualcosa è andato storto, c'è sempre il log file in

<code>/var/log/httpd</code>. Mentre si fanno queste prove consiglio

di tenere sempre aperta una finestra dedicata alla visualizzazione dei

messaggi di log tramite il comando <code>tail -f /var/log/httpd/*</code>.

</p>

<p>

Se è tutto ok, puntiamo il WEB browser

sull'URL <code>http://www.tizio.casa</code> e poi su

<code>http://www.caio.casa</code>. Ecco quello che io ho ottenuto:

</p>

<pre>

        $ <b>(echo -ne "GET / HTTP/1.1\nHost: www.tizio.casa\n\n"</b>

        > <b>sleep 2) | telnet localhost 80</b>

        Trying 127.0.0.1...

        Connected to localhost.localdomain.

        Escape character is '^]'.

        HTTP/1.1 200 OK

        Date: Wed, 11 Dec 2001 21:33:20 GMT

        Server: Apache/1.3.19 (Unix)  (Red-Hat/Linux)

        Last-Modified: Mon, 10 Dec 2001 07:55:23 GMT

        ETag: "fa7b-43-3c146a6b"

        Accept-Ranges: bytes

        Content-Length: 67

        Content-Type: text/html

        <html><body>Benvenuto in www.tizio.casa</body></html>

        Connection closed by foreign host.

</pre>

<a name=esperimentiinteressanti></a>

<h2>Esperimenti interessanti</h2>

<p>

Prova questo comando:

</p>

<pre>

    # <b>(echo -ne "GET / HTTP/1.0\n\n"; sleep 2)  \</b>

    > <b>| telnet localhost 80 | head -20</b>

</pre>

<p>

che dovrebbe ritornare il primo virtual host (che al momento dovrebbe

essere quello del sig. Tizio). Possiamo provare anche ad aggiungere il

virtual host <code>localhost.localdomain</code> come primo virtual host

e ripetere la prova.

</p>

<p>

Adesso sfruttiamo il protocollo HTTP v. 1.1 per ritornare gli altri

virtual host. Per il isg. Caio si tratta di aggiungere la riga <code>Host:

www.caio.casa</code> nella nostra interrogazione:

</p>

<pre>

    # <b>(echo -ne "GET / HTTP/1.0\nHost: www.caio.casa\n\n"; sleep 2)  \</b>

    > <b>| telnet localhost 80 | head -20</b>

</pre>

<p>

Le stesse prove si possono fare anche da un browser WEB "normale",

ma si perde tutto il gusto...

</p>

<p>

Con questo abbiamo concluso il nostro tour sul meccanismo dei

domini virtuali.  In una situazione realistica avremo che i

domini <code>www.tizio.casa</code> e <code>www.caio.casa</code>

saranno registrati su un qualche DNS (e non nel nostro file

<code>/etc/hosts</code>), e l'indirizzo IP da assegnare ai VirtualHost

sarà l'indirizzo pubblico assegnato alla nostra macchina (e non

l'indirizzo di loopback 127.0.0.1).

</p>

<a name=webdinamicoeprogrammicgi></a>

<h2>WEB dinamico e programmi CGI</h2>

<p>

Il WEB sarebbe ben poca cosa se senza la possibilità di generare

dinamicamente le pagine richieste e senza la possibilità di

interagire con il client remoto. Il protocollo HTTP da una parte,

e le tecnologie CGI e SSI di Apache dall'altra sono gli strumenti che

forniscono queste possibilità.  Apache viene corredato anche con

vari interpreti incorporati, tipicamente PHP e PERL, che permettono una

esecuzione molto efficiente di codice di scripting incorporato all'interno

delle pagine WEB.

</p>

<p>

Spendiamo due parole per chiarire cos'è un <i>programma CGI</i>: si

tratta appunto di un programma, realizzabile con un qualsiasi linguaggio

di programmazione o di scripting, che può essere invocato come

una pagina WEB o come gestore di un <code>form</code> HTML; il WEB

server, invece che ritornare al client il file del programma, lo esegue

e l'output generato da questo programma è quello che il server

và a restituire al client, sia essa una pagina HTML, una immagine

GIF o qualsiasi altro tipo di informazione sia eccettabile nel WEB.

Le specifiche della interfaccia CGI dicono anche come il programma CGI

possa ricevere input dal client, chiudendo quindi il cerchio.  Rimandiamo

al prossimo articolo la discussione dettagliata della tecnologia CGI,

delle possibilità che essa offre, e dei possibili utilizzi pratici.

</p>

<p>

Tuttavia, nuove possibilità significano nuovi problemi per

l'amministratore del sistema. Cerchiamo di capire meglio il problema

introducendo l'importantissima questione della identità dei

processi CGI.

</p>

<p>

Abbiamo detto che il server Apache è un processo avviato

con l'identità UID:GID = <code>nobody:nobody</code> nella

distribuzione Linux Red Hat 6.2, oppure con l'identità UID:GID =

<code>apache:apache</code> nella distribuzione Linux Red Hat 7.1. Con

altre distribuzioni di Linux questa identità può cambiare,

ma resta il fatto che Apache funziona con questa unica identità.

L'identità del processo impone anche i limiti per quanto riguarda

l'accesso alle risorse del sistema:

</p>

<ul>

<li>attraversamento di directory;<p>

<li>elencazione del contenuto delle directory;<p>

<li>creazione e cancellazione di file in una data dir.;<p>

<li>lettura/scrittura/esecuzione dei file;<p>

<li>accesso a un DBMS;<p>

<li>accesso alle altre risorse del sistema.

</ul>

<p>

I programmi CGI avviati da Apache ereditano l'identità di processo

di quest'ultimo anche quando questi programmi appartengono ad utenti

diversi.  Lo stesso discorso vale per gli interpreti incorporati PHP

e PERL.  Quindi, ad esempio, le funzioni per gestire i file richiedono di

impostare opportunamente i permessi e la proprietà della directory

dove il file risiede, oltre che i permessi e la proprietà del file

stesso. Non è possibile creare file in directory non accessibili

al server, nè è possibile leggere file non leggibili per

il server.

</p>

<p>

Supponiamo ora che i programmi CGI prodotti dal sig. Tizio e dal sig. Caio

abbiano necessità di svolgere varie funzioni: esattamente come

qualsiasi altro programma, i loro CGI avranno bisogno di leggere e scrivere

file, accedere a un DB e altre cose del genere. Purtroppo, i siccome i loro

programmi CGI verranno eseguiti con la stessa identità, saremo costretti

ad assegnare diritti di accesso in comune a tutti i CGI. Per essere più

espliciti: a livello di CGI gli utenti Tizio e Caio potranno pasticciare

liberamente sugli stessi file. Il sig. Tizio non potrà leggere o

scrivere un suo file riservato senza che questo non sia leggibile anche

al sig. Caio. Il Sig. Tizio vorrà accedere a un DBMS riservato

specificando una password, ma se usa un linguaggio di scripting il suo

programma deve necessariamente essere leggibile ai programmi CGI degli

altri utenti, che potranno così carpirgli facilmente la password.

Il sig. Tizio non potrà leggere o scrivere file nella propria home

directory (al di fuori di <code>public_html</code>) senza dover

pericolosamente rilassare i diritti di accesso al suo account.

In altri termini, abbiamo un sistema multiutente che, a livello del server

WEB, diventa monoutente...

</p>

<p>

Pensiamo invece a quanto sarebbe logicamente bello e praticamente utile

se i programmi CGI di un utente fossero eseguiti con l'identità

dell'utente stesso: il programma avrebbe pieno accesso al suo account e potrebbe

leggere e scrivere file; i CGI non sarebbero leggibili nè copiabili

dagli altri utenti, anche quando si trattasse di script; l'autenticazione

al DBMS potrebbe essere automatica perchè basata sulla identità

del processo; ecc. Tutte queste possibilità offrono agli utenti

molte opportunità di sfruttare in modo creativo le tecnologie del WEB.

</p>

<p>

Esiste anche un rovescio della medaglia: l'esecuzione di programmi

CGI qualora siano realizzati come script richiede più tempo per

l'avviamento  rispetto agli stessi programmi eseguiti dagli interpreti

incorporati in Apache. Del resto, se un sito WEB comporta realmente un

grande flusso di traffico, forse vale la pena di dedicare ad esso un

server completo, per cui l'obiezione è valida solo in parte.

</p>

<a name=suexecovverodelbracciodestrodeldemonio></a>

<h2>SUEXEC - Ovvero del braccio destro del Demonio</h2>

<p>

La documentazione di Apache è estrememente prudente in proposito:

SUEXEC è uno strumento potente, ma altrettanto potentemente

insidioso per la sicurezza dalle intrusioni. L'esperienza del passato

ha lasciato alcune vittime, ma gli sviluppatori di Apache hanno studiato

contromosse altrettanto diaboliche. Rimando perciò a questa fonte

per la discussione della questione. Noi sfideremo intrepidi il rischio,

ansiosi di esplorare le nuove dimensioni che si dischiuderanno.

</p>

<p>

Il famigerato SUEXEC di Apache non è altro che un programmino

di una decina di KB che si occupa di avviare i CGI per conto di Apache,

conferendo però al processo così avviato l'identità

del suo proprietario. Quindi, ad esempio, i CGI del sig. Tizio verranno

eseguiti con l'identità UID:GID = <code>tizio:users</code>.

Il SUEXEC si preoccupa di garantire che il processo avviato sia legittimo.

La tabellina qui sotto riassume le identità dei vari processi nel

caso di un programma CGI <code>mio.cgi</code> avviato per conto del sig. Tizio:

</p>

<center>

<table border=1 cellpadding=5>

<tr>

<th>Processo</th><th>UID</th><th>GID</th></tr>

<td><code>httpd</code></td><td><code>nobody</code> (RH6.2)<br><code>apache</code> (RH7.1)</td><td><code>nobody</code> (RH6.2)<br><code>apache</code> (RH7.1)</td></tr>

<tr><td><code>suexec</code></td><td><code>root</code></td><td><code>nobody</code> (RH6.2)<br><code>apache</code> (RH7.1)</td></tr>

<tr><td><code>mio.cgi</code></td><td><code>tizio</code></td><td><code>users</code></td></tr>

</table>

</center>

<p>

La distribuzione Red Hat viene con il programma <code>suexe</code>

già pronto, ma disattivato. Inoltre, il programma prevede,

tra gli infiniti controlli, che il CGI avviato si trovi dentro alla

directory <code>/home/httpd</code> (o in altra directory prevista dalla

distribuzione), sicché non è adatto alla nostra situazione.

</p>

<p>

Se la tua distribuzione non include il programma

<code>/usr/sbin/suexec</code> (è infatti questo il nome al secolo

dell'innominabile), allora dovrai proprio procedere alla compilazione dei

sorgenti di <u>tutto</u> Apache, oltre che scaricare la patch SUEXEC dal

sito ufficiale. In questo caso seguire scrupolosamente le indicazioni

fornite, eccetto che il pathfile della directory dei CGI dovrà

essere <code>/home</code>. Buon lavoro e buona fortuna. Ci rivediamo al

prossimo paragrafo sugli ScripAlias.

</p>

<p>

Se invece sei un pigro, troverai più veloce ed indolore la ricetta

che segue, valida per le distribuzioni Red Hat 6.2 e 7.1.

</p>

<p>

suexec è abilitato per eseguire i CGI solo nella directory

<code>/home/httpd/</code> (RH6.2) o nella dir. <code>/var/www</code>

(RH7.1): per abilitare il meccanismo nelle dir. degli utenti

<code>/home</code> è necessario ricompilare il programma suexec

cambiando opportunamente la configurazione hard-coded. Poiché ci

secca di intraprendere questo lungo e impervio cammino, scegliamo una

scorciatoia sporca: andremo a cambiare il codice del programma con un

editor binario! Io ho usato l'editor del potente Midnight Commander:

</p>

<ul>

<li>Apri il file <code>/usr/sbin/suexec</code> da mc, e usa l'editor binario

integrato di Midnight Commander.

<p>

<li>Ora dobbiamo cambiare il path dove suexec consente di eseguire

CGI col meccanismo del suexec. Per la RH6.2, individua la stringa

<code>/home/httpd/html</code> e inserisci uno zero al posto del secondo

slash: in questo modo per il programma la stringa risulterà

troncata a solo <code>/home</code>. Per la RH7.1 invece, individua la

stringa <code>/var/www/</code> e modificarla in <code>/home</code>,

ricordando sempre di mettere un byte zero in fondo, e sempre senza

cambiare la lunghezza complessiva del file. In entrambi i casi, i

caratteri d'avanzo dopo il byte nullo inserito sono irrilevanti. Un

errore in questa fase renderebbe inutilizzabile il file suexec. Ne hai

già fatto una copia, vero?

<p>

<li>Nel file suexec è hard-coded anche il nome dell'utente sotto

il quale viene eseguito Apache. Nella RH6.2 è <code>nobody</code>,

mentre nella RH7.1 è <code>apache</code>.

Se nella tua configurazione personalizzata hai modificato l'identità

del server Apache, dovrai individuare questa stringa e modificarla

di conseguenza, sempre nello stesso modo. Di norma non dovrebbe

però essere necessario.

<p>

</ul>

<p>

Per la RH6.2 e RH7.1 è sufficiente attivare

il bit SUID del programma suexec, e magari restringere il set di permessi

inutilmente ampi che la distribuzione attribuisce al file. Per la RH6.2:

</p>

<pre>

        # <b>chown  root:nobody  /usr/sbin/suexec</b>

        # <b>chmod  u=xs,g=x,o=  /usr/sbin/suexec</b>

</pre>

mentre per la RH7.1 cambia solo il nome del gruppo proprietario:

<pre>

        # <b>chown  root:apache  /usr/sbin/suexec</b>

        # <b>chmod  u=xs,g=x,o=  /usr/sbin/suexec</b>

</pre>

Adesso il suexec è a posto: controlla che l'identità

e i permessi del file suexec appaiano così nella RH6.2:

<pre>

        # <b>ls -l /usr/sbin/suexec</b>

        ---s--x---  1 root  nobody    9488 Aug 12 14:19 /usr/sbin/suexec

</pre>

mentre nella RH7.1 dovrebbero apparire cosi':

<pre>

        # <b>ls -l /usr/sbin/suexec</b>

        ---s--x---  1 root  apache   10976 Aug 12 13:05 /usr/sbin/suexec

</pre>

<p>

Se non corrispondono, agire con <code>chown</code> e <code>chmod</code>

opportunamente.

</p>

<p>

Non rimane che riavviare Apache. Nel log file <code>/var/log/httpd/access_log</code> dovrebbe apparire:

<pre>

        [notice] caught SIGTERM, shutting down

        [notice] Apache/1.3.19 (Unix)  (Red-Hat/Linux) configured

                 -- resuming normal operations

        [notice] <b>suEXEC mechanism enabled (wrapper: /usr/sbin/suexec)</b>

</pre>

<p>

La riga che ci interessa è l'ultima, è ci rassicura che

Apache ha digerito il nostro suexec!

</p>

<a name=scriptaliasdefinirelaledirectorydeicgi></a>

<h2>ScriptAlias - Definire la/le directory dei CGI</h2>

<p>

Il nome di questa direttiva di Apache è fuorviante, perché

lascia pensare che riguardi solo gli script. In realtà si tratta

di una regola di matching che permette ad Apache di stabilire se un certo

file va considerato come documento o come programma CGI. Nel primo caso

Apache tenterà di riconoscerne il tipo e lo restituirà

al client che lo ha richiesto. Nel secondo caso Apache lancerà il

programma come CGI; siccome abbiamo appena attivato il supporto SUEXEC,

il programma assumerà l'identità del proprietario.

Esiste anche <code>ScripAliasMatch</code>, che permette di utilizzare

anche espressioni regolari: ne vedremo degli esempi.

</p>

<p>

Le direttive <code>ScriptAlias</code> e <code>ScriptAliasMatch</code>

possono apparire nella configurazione globale del server, e anche nelle

sezioni dei VirtualHost.  La scelta più tradizionale prevede

di collocare i CGI nella directory <code>/cgi-bin</code> della root

directory del sito. In tal caso come direttiva globale metteremo

<pre>

        ScriptAlias /cgi-bin/  /home/httpd/cgi-bin/

</pre>

Dato che abbiamo già fatto la configurazione degli host virtuali,

nelle sezioni dei VirtualHost metteremo qualcosa come

<pre>

         <VirtualHost 127.0.0.1:80>

         ServerName www.tizio.casa

         <b>User tizio</b>

         <b>Group users</b>

         DocumentRoot /home/tizio/public_html

         ServerAdmin tizio@localhost

         <b>ScriptAlias /cgi-bin/ /home/tizio/public_html/cgi-bin/</b>

         CustomLog logs/www.tizio.casa-access_log common

         ErrorLog logs/www.tizio.casa-error_log

         </VirtualHost>

</pre>

<p>

Le direttive <code>User</code> e <code>Group</code> dicono al programma

<code>suexec</code> quale dovrebbe essere l'identità del

programma CGI: <code>suexec</code> esegue poi un controllo stringente

sulla proprietà del file e sui suoi diritti di accesso prima di

autorizzarne l'esecuzione con l'identità stabilita.<br>

La direttiva <code>ScriptAlias</code> dichiara dove

si trova la directory dei CGI, e mappa gli URL del tipo

<code>http://www.tizio.casa/cgi-bin/xxx</code> nel pathfile

<code>/home/tizio/public_html/cgi-bin/xxx</code>.

</p>

<a name=scriptaliasmatchunnomeuncgi></a>

<h2>ScripAliasMatch - Un nome, un CGI</h2>

<p>

Più potente la direttiva <code>ScriptAliasMatch</code>: diventa

possibile utilizzare espressioni regolari per identificare i programmi

CGI. Per fare un esempio, possiamo istruire Apache a riconoscere

come programma CGI ogni file il cui nome termina con la stringa

"<code>.cgi</code>". A questo scopo basta una direttiva globale come

questa:

<pre>

        ScriptAliasMatch /(.*)\.cgi  /home/httpd/html/$1.cgi

</pre>

Per i VirtualHost aggiungeremo invece:

<pre>

         <VirtualHost 127.0.0.1:80>

         ServerName www.tizio.casa

         User tizio

         Group users

         DocumentRoot /home/tizio/public_html

         ServerAdmin tizio@localhost

         ScriptAlias /cgi-bin/ /home/tizio/public_html/cgi-bin/

         <b>ScriptAliasMatch /(.*)\.cgi  /home/tizio/public_html/$1.cgi</b>

         CustomLog logs/www.tizio.casa-access_log common

         ErrorLog logs/www.tizio.casa-error_log

         </VirtualHost>

</pre>

<p>

Questa volta la direttiva <code>ScriptAliasMatch</code> mappa URL

del tipo <code>http://www.tizio.casa/x/y/z.cgi</code> nel pathfile

<code>/home/tizio/public_html/x/y/z.cgi</code>, ed istruisce anche Apache

che questo file è un CGI da eseguire.

</p>

<a name=homepagepersonali></a>

<h2>Home page personali</h2>

<p>

Avrai visto qualche volte un URL del tipo

</p>

<pre>

        www.qualcosa.org/~tizio

</pre>

<p>

dove <code>tizio</code> è un qualche individuo che rende

disponibile la sua home page pur senza disporre di un dominio

registrato. Il carattere tilde viene utilizzato per convenzione a questo

scopo. Sulle tastiere italiane si ottiene la tilde premendo ALT+123

(su Windows) o, in alternativa, indicando nell'URL la sequenza %7e. Nel

primo caso, 125 è il codice ASCII della tilde espresso nella base

decimale; nel secondo caso è lo stesso numero espresso nella base

esadecimale e nella convenzione della codifica degli URL.

</p>

<p>

Comunque sia, è pratica comune consentire agli utenti dei sistemi

Unix (e quindi anche Linux) di predisporre la propria home page. Per

attivare il meccanismo della tilde in Apache bisogna inserire questa

direttiva nella parte globale della configurazione:

</p>

<pre>

        UserDir public_html

</pre>

<p>

il cui significato è il seguente: mappa gli URL della forma

<code>http://localhost.localdomain/~utente</code> nel pathfile

<code>/home/utente/public_html</code>. Si possono abilitare anche i CGI

nel solito modo:

</p>

<pre>

        ScriptAliasMatch /~(.*)/(.*)\.cgi  /home/$1/public_html/$2.cgi

</pre>

<p>

Il pattern <code>(.*)</code> esegue il match col nome dell'utente, che viene

sostituito in $1; di conseguenza la stringa <code>(.*)</code> deve

eseguire il match con tutto ciò che resta, che viene sostituito

in $2. Il risultato di queste due sostituzioni fornisce ad Apache il

pathfile assoluto del CGI nel file system. Quindi, ad esempio, l'URL

</p>

<pre>

        http://localhost.localdomain/~tizio/x/y/z.cgi

</pre>

<p>

produce gli assegnamenti <code>$1=tizio</code>, <code>$2=x/y/z</code>

e quindi in definitiva Apache invoca il CGI

</p>

<pre>

        /home/tizio/public_html/x/y/z.cgi

</pre>

<a name=proviamoilsuexec></a>

<h2>Proviamo il SUEXEC</h2>

<p>

Finalmente, siamo giunti alla conclusione. Sinceramente non credo sia

cosa sana tentare tutte le pratiche configuratorie viste fin qua e

ridursi solo ora a provare le cose. Più probabile che tu abbia

fatto le tue prove un po' alla volta modificando progressivamente il

file preconfezionato.

</p>

<p>

Comunque sia andata, adesso bisogna proprio verificare il funzionamento

SUEXEC.  A questo scopo conviene loggarsi come utente, per esempio

il sig. Tizio, in modo che tutti i file e le directory create avranno

automaticamente l'identità giusta e faranno contento SUEXEC, che

così non si lamenterà. Crea uno script di test come questo:

<pre>

        #!/bin/bash

        echo "Content-Type: text/plain"

        echo ""

        echo "Identita':"

        id

</pre>

chiamalo <code>/home/tizio/public_html/test.cgi</code> e rendilo

eseguibile:

<pre>

        $ <b>chmod  u=rwx,go=  test.cgi</b>

</pre>

<p>

Eseguilo localmente per vedere se funziona (<code>./test.cgi</code>),

quindi prova l'URL <code>http://www.tizio.casa/test.cgi</code>. Se

hai configurato le home page degli utenti puoi provare anche

<code>http://localhost/~tizio/test.cgi</code>.  Sul browser

dovrebbe apparire l'id <code>tizio/users</code>, prova provata che

il nostro programmino <code>test.cgi</code> è stato eseguito

con l'identità del suo proprietario.

Ecco quello che vedo io:

</p>

<pre>

        $ <b>(echo -ne "GET /test.cgi HTTP/1.0\nHost: www.tizio.casa\n\n"</b>

        > <b>sleep 2) | telnet localhost 80</b>

        Trying 127.0.0.1...

        Connected to localhost.localdomain.

        Escape character is '^]'.

        HTTP/1.1 200 OK

        Date: Tue, 11 Dec 2001 21:15:53 GMT

        Server: Apache/1.3.19 (Unix)  (Red-Hat/Linux)

        Connection: close

        Content-Type: text/plain

        Identita':

        uid=506(<b>tizio</b>) gid=100(<b>users</b>) groups=100(users)

        Connection closed by foreign host.

</pre>

<p>

La cosa importante sono lo due paroline evidenziate in grassetto,

<code>tizio</code> e <code>user</code>: è per vederle comparire

che abbiamo fatto tutta 'sta trafila del SUEXEC.  Congratulazioni, obiettivo

centrato!

</p>

<p>

Se invece, come è probabile, salta fuori qualcos'altro, allora

non resta che ripercorrere tutti i passi della configurazione fatta fin

qui, tenendo sempre aperta una bella finestra con <code>tail -f</code>

dei file di log come abbiamo visto.  Alcuni suggerimenti diagnostici:

</p>

<dl>

<dt><b>Netscape mostra sempre lo stesso risultato comunque io agisca.</b>

<dd>Bisogna premere il bottone <b>Reload</b> del browser mentre si tiene

premuto il tasto <b>SHIFT</b>, altrimenti Netscape restituisce quello che

ha nella cache.

<p>

<dt><b>Il browser risponde "Not Found" e sul log file appare "unable

to stat".</b>

<dd>Apache ha risolto l'URL nel pathfile, come viene specificato nel log;

sfortunatamente, tale file non esiste, oppure i permessi delle directory

non permettono ad Apache (che in questa fase ha ancora l'identità

standard) di attraversare una o più delle directory del pathfile.

Controlla il corretto pathfile. Controlla i permessi della directory

home di <code>tizio</code>.

<p>

<dt><b>Il browser mostra che lo script ha identità diversa da

<code>tizio/users</code>.</b>

<dd>Non sta funzionando SUEXEC. Controlla nel log file se all'avvio

di Apache compare il messaggio esplicito della attivazione del

SUEXEC.  Controlla la presenza delle direttive <code>User</code> e

<code>Group</code> nella sezione <code>VirtualHost</code> del dominio

<code>www.tizio.casa</code>.

<p>

<dt><b>Il browser mostra il sorgente dello script.</b>

<dd>Controlla la direttiva <code>ScriptAliasMatch</code> nella sezione

<code>VirtualHost</code> del dominio <code>www.tizio.casa</code>.

</dl>

<p>

Infine, confronta il tuo file di configurazione con quello che riporto

qui più avanti.

</p>

<a name=ritocchifinali></a>

<h2>Ritocchi finali</h2>

<p>

Rimane ora solo da disabilitare gli interpreti PHP e PERL incorporati

in Apache. È facile, basta commentare tutte le righe di

<code>http.conf</code> che si riferiscono a questi linguaggi. Potremo

sempre usare il PHP e il PERL nei nostri CGI, ma nelle loro versioni

stand-alone consuete.

</p>

<p>

La direttiva globale

</p>

<pre>

        DirectoryIndex index.html index.htm index.shtml index.cgi

</pre>

<p>

istruisce il server su quale pagina ritornare quando il client esegue una

<code>GET /</code> o comunque un'altra directory, senza specificare un

file preciso all'interno di questa directory. In questi casi, Apache tenta

di ritornare i file specificati, nell'ordine. Le prime voci sono quelle

consuete, mentre l'ultima l'ho aggiunta per l'occasione.  per inciso,

se nessuno di questi file esiste, Apache ritorna l'elenco dei file della

directory se è presente la direttiva <code>Option Indexes</code>,

altrimenti dà un bel "Forbidden".

</p>

<a name=httpdconfintuttalasuagloria></a>

<h2><code>httpd.conf</code> in tutta la sua gloria</h2>

<p>

Giunti alla conclusione di questo lungo cammino, ecco come appare il mio

<code>httpd.conf</code>. Raccomando, prima di procedere ad uno sbrigativo

taglia-e-incolla, di fare una copia del vostro attuale file di configurazione,

e per due buoni motivi: 1) contiene molti utili commenti, qui omessi;

2) funziona.

</p>

<p>

Alcuni moduli opzionali li ho commentati, ma si possono re-inserire secondo

necessità. La loro omissione velocizza parecchio l'avvio, e riduce

il consumo di memoria.

</p>

<p>

Ho lasciato commentate anche alcune funzionalità che hanno valore

di commento per le personalizzazioni successive. Anche qui, vedere la

documentazione di Apache per il significato delle varie direttive.

</p>

<pre>

####### httpd.conf: INIZIO

ServerType standalone

ServerRoot "/etc/httpd"

LockFile /var/lock/httpd.lock

PidFile /var/run/httpd.pid

#ScoreBoardFile /var/run/httpd.scoreboard

Timeout 300

KeepAlive On

MaxKeepAliveRequests 10

KeepAliveTimeout 60

MinSpareServers 2

MaxSpareServers 10

# Pochi processi --> risparmio memoria; riavvii + veloci

StartServers 2

MaxClients 10

MaxRequestsPerChild 100

# Carico solo quello che mi serve:

#LoadModule vhost_alias_module modules/mod_vhost_alias.so

LoadModule env_module         modules/mod_env.so

LoadModule config_log_module  modules/mod_log_config.so

#LoadModule agent_log_module   modules/mod_log_agent.so

LoadModule referer_log_module modules/mod_log_referer.so

LoadModule mime_module        modules/mod_mime.so

#LoadModule negotiation_module modules/mod_negotiation.so

#LoadModule status_module      modules/mod_status.so

#LoadModule info_module        modules/mod_info.so

#LoadModule includes_module    modules/mod_include.so

LoadModule autoindex_module   modules/mod_autoindex.so

LoadModule dir_module         modules/mod_dir.so

LoadModule cgi_module         modules/mod_cgi.so

#LoadModule asis_module        modules/mod_asis.so

#LoadModule imap_module        modules/mod_imap.so

#LoadModule action_module      modules/mod_actions.so

LoadModule userdir_module     modules/mod_userdir.so

LoadModule alias_module       modules/mod_alias.so

#LoadModule rewrite_module     modules/mod_rewrite.so

LoadModule access_module      modules/mod_access.so

LoadModule auth_module        modules/mod_auth.so

#LoadModule anon_auth_module   modules/mod_auth_anon.so

#LoadModule db_auth_module     modules/mod_auth_db.so

#LoadModule digest_module      modules/mod_digest.so

#LoadModule proxy_module       modules/libproxy.so

#LoadModule expires_module     modules/mod_expires.so

#LoadModule headers_module     modules/mod_headers.so

#LoadModule usertrack_module   modules/mod_usertrack.so

LoadModule setenvif_module    modules/mod_setenvif.so

ClearModuleList

#AddModule mod_vhost_alias.c

AddModule mod_env.c

AddModule mod_log_config.c

#AddModule mod_log_agent.c

AddModule mod_log_referer.c

AddModule mod_mime.c

#AddModule mod_negotiation.c

#AddModule mod_status.c

#AddModule mod_info.c

#AddModule mod_include.c

AddModule mod_autoindex.c

AddModule mod_dir.c

AddModule mod_cgi.c

#AddModule mod_asis.c

#AddModule mod_imap.c

#AddModule mod_actions.c

AddModule mod_userdir.c

AddModule mod_alias.c

#AddModule mod_rewrite.c

AddModule mod_access.c

AddModule mod_auth.c

#AddModule mod_auth_anon.c

#AddModule mod_auth_db.c

#AddModule mod_digest.c

#AddModule mod_proxy.c

#AddModule mod_expires.c

#AddModule mod_headers.c

#AddModule mod_usertrack.c

AddModule mod_so.c

AddModule mod_setenvif.c

Listen 80

####### Red Hat 6.2:

User nobody

Group nobody

####### Red Hat 7.1:

#User apache

#Group apache

ServerAdmin root@localhost

# Permessi globali:

<Directory />

    Options IncludesNOEXEC Indexes SymLinksIfOwnerMatch

    AllowOverride None

</Directory>

UserDir public_html

# Permessi di base per le dir. degli utenti:

<Directory "/home/*/public_html">

    AllowOverride All

    Options Includes Indexes SymLinksIfOwnerMatch

    Order allow,deny

    Allow from all

</Directory>

ScriptAliasMatch /~(.*)/(.*)\.cgi  /home/$1/public_html/$2.cgi

ScriptAliasMatch /~(.*)/cgi-bin/(.*)  /home/$1/public_html/$2

<Directory /home/*/public_html/cgi-bin>

        AllowOverride All

        Options ExecCGI

</Directory>

DirectoryIndex index.html index.htm index.shtml index.cgi _index

AccessFileName .htaccess

<Files ~ "^\.ht">

    Order allow,deny

    Deny from all

</Files>

UseCanonicalName On

TypesConfig /etc/mime.types

DefaultType text/plain

HostnameLookups Off

ErrorLog /var/log/httpd/error_log

LogLevel warn

#LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined

LogFormat "%h %l %u %t \"%r\" %>s %b" common

#LogFormat "%{Referer}i -> %U" referer

#LogFormat "%{User-agent}i" agent

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\"" mioformatolog

CustomLog /var/log/httpd/access_log mioformatolog

ServerSignature On

Alias /icons/ "/home/httpd/icons/"

<Directory "/home/httpd/icons">

    Options Indexes MultiViews

    AllowOverride None

    Order allow,deny

    Allow from all

</Directory>

IndexOptions FancyIndexing

AddIconByEncoding (CMP,/icons/compressed.gif) x-compress x-gzip

AddIconByType (TXT,/icons/text.gif) text/*

AddIconByType (IMG,/icons/image2.gif) image/*

AddIconByType (SND,/icons/sound2.gif) audio/*

AddIconByType (VID,/icons/movie.gif) video/*

AddIcon /icons/binary.gif .bin .exe

AddIcon /icons/binhex.gif .hqx

AddIcon /icons/tar.gif .tar

AddIcon /icons/world2.gif .wrl .wrl.gz .vrml .vrm .iv

AddIcon /icons/compressed.gif .Z .z .tgz .gz .zip

AddIcon /icons/a.gif .ps .ai .eps

AddIcon /icons/layout.gif .html .shtml .htm .pdf

AddIcon /icons/text.gif .txt

AddIcon /icons/c.gif .c

AddIcon /icons/p.gif .pl .py

AddIcon /icons/f.gif .for

AddIcon /icons/dvi.gif .dvi

AddIcon /icons/uuencoded.gif .uu

AddIcon /icons/script.gif .conf .sh .shar .csh .ksh .tcl

AddIcon /icons/tex.gif .tex

AddIcon /icons/bomb.gif core

AddIcon /icons/back.gif ..

AddIcon /icons/hand.right.gif README

AddIcon /icons/folder.gif ^^DIRECTORY^^

AddIcon /icons/blank.gif ^^BLANKICON^^

DefaultIcon /icons/unknown.gif

ReadmeName README

HeaderName HEADER

IndexIgnore .??* *~ *# HEADER* README* RCS CVS *,v *,t

AddEncoding x-compress Z

AddEncoding x-gzip gz tgz

AddLanguage en .en

AddLanguage fr .fr

AddLanguage de .de

AddLanguage da .da

AddLanguage el .el

AddLanguage it .it

# v. mod_negotiation

#LanguagePriority it en fr de

AddType text/html .shtml

AddHandler server-parsed .shtml

AddHandler imap-file map

BrowserMatch "Mozilla/2" nokeepalive

BrowserMatch "MSIE 4\.0b2;" nokeepalive downgrade-1.0 force-response-1.0

BrowserMatch "RealPlayer 4\.0" force-response-1.0

BrowserMatch "Java/1\.0" force-response-1.0

BrowserMatch "JDK/1\.0" force-response-1.0

NameVirtualHost 127.0.0.1:80

<VirtualHost 127.0.0.1:80>

    ServerName localhost.localdomain

    DocumentRoot /home/httpd/html

    ServerAdmin root@casa.lan

    ErrorLog logs/localhost.localdomain-error_log

    CustomLog logs/localhost.localdomain-access_log common

</VirtualHost>

<VirtualHost 127.0.0.1:80>

    ServerName www.tizio.casa

    User tizio

    Group users

    DocumentRoot /home/tizio/public_html

    ServerAdmin root@casa.lan

    ErrorLog logs/www.tizio.casa-error_log

    CustomLog logs/www.tizio.casa-access_log common

    ScriptAlias /cgi-bin /home/tizio/public_html/cgi-bin

    ScriptAliasMatch /(.*)\.cgi  /home/tizio/public_html/$1.cgi

</VirtualHost>

<VirtualHost 127.0.0.1:80>

    ServerName www.caio.casa

    User caio

    Group users

    DocumentRoot /home/caio/public_html

    ServerAdmin root@casa.lan

    ErrorLog logs/www.caio.casa-error_log

    CustomLog logs/www.caio.casa-access_log common

    ScriptAlias /cgi-bin /home/caio/public_html/cgi-bin

    ScriptAliasMatch /(.*)\.cgi  /home/caio/public_html/$1.cgi

</VirtualHost>

#### httpd.conf: FINE!

</pre>

<a name=conclusioni></a>

<h2>Conclusioni</h2>

<p>

Abbiamo visto come in ambiente multiutente si possono creare siti WEB

per domini virtuali, abbiamo collocato questi siti in spazi isolati

del sistema, abbiamo visto come ciascun soggetto possa creare i propri

programmi CGI che girano con la propria identità.  Ogni utente

può creare file e gestire dati nello spazio della propria home

directory, senza interferenze con gli altri utenti.

</p>

<p>

Ho verificato tutti gli esempi presentati qui, ho installato e configurato

il mio computer come descritto, e tutto mi funziona. Tuttavia la materia

è abbastanza complessa, e la configurazione di un programma come

Apache richiede comunque l'attenta lettura del suo manuale per poterne

sfruttare tutte le potenzialità e per risolvere i problemi che

inevitabilmente si possono incontrare. Non mi illudo di essere stato esaustivo,

nè tantomeno infallibile. Ecco perché ho già predisposto

una pagina WEB all'indirizzo

<a href="http://digilander.iol.it/salsi/erratacorrige"><code>http://digilander.iol.it/salsi/erratacorrige</code></a> dove ospitare le inevitabili correzioni e

le integrazioni che si dovessero rendere necessarie. Ovviamente, si tratta

di una vile manovra scaramantica.

</p>

<p>

Nella prossima puntata affronteremo in dettaglio la tecnologia dei

CGI, vedremo il famigerato meccanismo dei cookie, e costruiremo i primi

programmi CGI di utilità. Per fare questo useremo un linguaggio di

programmazione che tutti gli utilizzatori di Linux sicuramente già

conoscono: Bash, la shell più comunemente utilizzata.

</p>

<p>

Che il grande totem sia con voi.

</p>

<a name=bibliografia></a>

<h2>Bibliografia</h2>

<b>Apache 1.3 User's Guide</b> - La documentazione ufficiale di Apche;

<a href="http://www.apache.org">http://www.apache.org/doc</a>.<br>

<b>RFC 2616</b> - Specifiche del protocollo HTTP versione 1.1;

<a href="http://www.rfc-editor.org">http://www.rfc-editor.org/</a>.<br>

</body>

</html>

_______________________________________________

pluto-journal mailing list

pluto-journal@lists.pluto.linux.it

http://lists.pluto.linux.it/mailman/listinfo/pluto-journal