leia a matéria em http://www.maujor.com/w3c/xhtml10_2ed.html que extraí para ficar como referência em meus estudos aqui no blog:
1. O que é XHTML?
Esta seção é informativa.
XHTML é uma família de módulos e documentos atuais e futuros que reproduzem, englobam e ampliam o HTML 4 [HTML4]. Os documentos da família XHTML são baseados em XML e modernamente têm sido projetados para trabalhar em conjunto com aplicações XML de usuários. Detalhes acerca desta família e da sua evolução são discutidos em: [XHTMLMOD].
XHTML 1.0 (a presente especificação) é o primeiro tipo de documento da família XHTML. É uma reformulação dos três tipos de documentos HTML 4 como aplicações de XML 1.0 [XML]. Foi concebida para ser uma linguagem de conteúdos em conformidade com XML e seguindo algumas diretrizes simples ser também compatível com aplicações de usuários em HTML 4. Desenvolvedores que migrarem seus conteúdos para XHTML 1.0 perceberão os seguintes benefícios:
* documentos XHTML estão em conformidade com XML. Como consequência serão lidos, visualizados, editados e validados com as ferramentas estandares do XML.
* documentos XHTML podem ser escritos para operar tão bem ou melhor do que o faziam, tanto em aplicações de usuário existentes conforme HTML 4 como com as modernas aplicações de usuário conforme XHTML 1.0.
* documentos XHTML podem utilizar-se de aplicações (por exemplo, scripts e applets) baseadas em HTML ou XML Modelo Objeto de Documento [ DOM ].
* Com a evolução da família XHTML, os documentos em conformidade com XHTML 1.0 estarão capacitados a interagir com e entre os variados ambientes XHTML.
A família XHTML é o próximo degrau na evolução da Internet. Migrando para XHTML os desenvolvedores de conteúdo estarão entrando no mundo XML com todos seus benefícios assegurando para seus conteúdos a compatibilidade com aplicações passadas e futuras
1.1. O que é HTML 4 ?
HTML 4 [HTML4] é uma aplicação SGML (Standard Generalized Markup Language) em conformidade com a International Standard ISO 8879, e está mundialmente reconhecida como a linguagem padrão para publicação World Wide Web.
SGML é uma linguagem para descrever linguagem de marcação, particularmente aquela linguagem utilizada para troca, gerenciamento e publicação eletrônica de documentos. HTML é um exemplo de linguagem definida em SGML.
SGML tem sido usada, desde os meados dos anos 80 e tem permanecido uma linguagem estável. Está estabilidade deve-se ao fato de SGML ser ao mesmo tempo diversificada e flexível. Contudo esta flexibilidade tem seu prêço, e o preço está no alto nível de complexidade da linguagem, o que tem inibido sua adoção em diversos ambientes, incluindo aí a World Wide Web.
HTML, foi concebida originariamente para ser uma linguagem destinada ao tráfego de documentos de caráter científico e técnico, adaptada para ser usada por não especialistas naqueles tipos de documentos. HTML contorna o problema da complexidade do SGML especificando um pequeno conjunto de tags com características estruturais e semânticas adaptadas para gerenciar documentos relativamente simples. Além de simplicar a estrutura dos documentos HTML adicionou suporte para HiperTexto. As facilidades de multi-mídia foram acrescidas posteriormente.
Em um espaço de tempo muito pequeno HTML tornou-se mundialmente popular e rapidamente ultrapassou seus propósitos iniciais. Desde os primórdios do HTML, tem sido inventados novos elementos tanto para uso com o HTML (como padrão) quanto para adaptações HTML, para atender a um mercado vertical altamente especializado. Esta proliferação de novos elementos trouxe consigo problemas de interoperabilidade dos documentos web com as diversas plataformas.
1.2. O que é XML?
XML™ é uma abreviação para Extensible Markup Language [XML].
XML foi concebida como uma maneira de resgatar a potencialidade e flexibilidade do SGML sem a sua complexidade. Embora sendo uma forma restrita de SGML, XML ainda assim, conserva todo o poder e riqueza das características do SGML.
XML conserva as características do SGML ao mesmo tempo que descarta aquelas mais complexas que tornavam a criação e projeto de programas adaptados, mais difícil e dispendiosa.