O JavaFree é uns dos maiores portais de Java em língua portuguesa e tive o prazer de colaborar com algum material há um tempo atrás.

Uma dessas contribuições foi um tutorial muito bem recebido sobre Expressões Regulares em Java. Já se vão quatro anos e o pessoal continua movimentando o tópico, o que me deixa muito satisfeito.

Segue o texto como foi publicado na época. Para o original clique aqui.

Introdução a Expressões Regulares com Java
Por Tadeu R. A. Santos

A partir da versão 1.4 do J2SE, Java conta com um bom suporte a expressões
regulares. Este tutorial tenta servir de introdução a este conceito com aplicação
Java.

1. O que são expressões regulares?

Trata-se de um método formal para se especificar um padrão de texto.
O uso de expressões regulares na computação é abundante e praticamente
pré-histórico. Isto se deve pela facilidade de se fazer comparações, a fim de achar
uma dada palavra (ou parte dela) em um texto.

2. Aplicações

Quando, em um SO de modo texto, deseja-se listar todos os arquivos começados por J
em um determinado diretório, basta fazer:

ls J* (unix like) ou
dir J* (dos)

Neste caso, o uso do caractere * dá-se de forma especial, significando “qualquer
cadeia de caractere (String)”. Assim serão mostrados arquivos como:

Java.txt;
JavaFree.rox;
JavaDetona.net;
Entre outros começados com J.

Chamamos J*, então, de expressão regular.
Como esse exemplo, existem centenas de aplicações onde as expressões regulares
poupam um bom trabalho na implementação.

Para fim de exemplo didático, será mostrado um código simples para validar endereços
de email (hello world das expressões regulares :D ).

3. Gramática das Expressões Regulares

Antes do exemplo, porém, seria de bom tom o conhecimento dos caracteres especiais
usados em expressões regulares. Apesar de ser um assunto extenso, será abordado
somente alguns dos caracteres especiais mais usados e aceitos pela API do Java, a
saber: [\^]?*+-.

*
Qualquer cadeia de caractere.

Expressão Regular: J*Free // Qualquer coisa que comece com J e termine com Free

String comparada: JavaFree
String válida: sim

String comparada: JavaPago
String válida: não

[ ]
Um dos elementos do conjunto

Expressão Regular: [rgp]ato // Qualquer palavra com a primeira letra sendo ou ‘r’ ou
‘g’ ou ‘p’, e as letras seguintes sendo “ato”

String comparada: pato
String válida: sim

String comparada: gato
String válida: sim

String comparada: xato
String válida: não

^
Exclusão

Expressão Regular: [^rgp]ato // Qualquer palavra cuja primeira letra NÃO é ‘r’ nem
‘g’ nem ‘p’, sendo “ato” o resto da palavra

String comparada: rato
String válida: não

String comparada: xato
String válida: sim

-
Intervalo

Expressão Regular: [H-L]avaFree // A primeira letra da palavra deve está entre H e L
(inclusive H e L)

String comparada: JavaFree
String válida: sim

String comparada: RavaFree
String válida: não

.
Qualquer caractere

Expressão Regular: JavaFre.

String comparada: JavaFree
String válida: sim

\
Classe de caracteres pré-definidos. São eles:

\d : Um dígito,
\D : Algo que não seja um dígito,
\s : Um espaço em branco,
\S : Algo que não seja um espaço em branco,
\w : Qualquer letra, dígito ou underscore ( _ )
\W : Algo que não seja letra, dígito ou underscore

Expressão regular: \wJavaFree\s200\d\w

String comparada: _JavaFree 2004_
String válida: sim
?
Uma ou nenhuma vez, assim como ‘*’, ‘?’ é um elemento quantificador.

Expressão regular: a? // Uma ou nenhuma ocorrência de ‘a’

String comparada:
String válida: sim

String comparada: a
String válida: sim

+
Uma ou mais vezes, assim como ‘*’ e ‘?’, é um elemento [i]quantificador[i].

Expressão regular: a+ // Uma ou mais ocorrências de ‘a’

String comparada:
String válida: não

String comparada: aaa
String válida: sim

Pode-se ainda combinar todos esses caracteres especiais em uma só expressão regular,
formando uma busca mais restringente.

4. Java API

Java dispõe de mecanismos muito bons para o tratamento de expressões regulares no
pacote java.util.regex . Para um melhor aproveitamento, é aconselhável o estudo da
documentação deste pacote disponível em:
http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/package-summary.html

Um objeto da classe Pattern contém a expressão regular desejada que será usada em
uma comparação. Já um objeto da classe Matcher contém os métodos que validarão nossa
String, dada uma expressão regular.

Ex.:


1. Pattern padrao = Pattern.compile("Java*");
2. Matcher pesquisa = padrao.matcher("JavaFree");
3.
4. if (pesquisa.matches())
5. {
6. System.out.println("JavaFree Rox");
7. }
8. else
9. {
10. System.out.println("Hum..?");
11. }

Pattern padrao = Pattern.compile(“Java*”); Matcher pesquisa = padrao.matcher(“JavaFree”); if (pesquisa.matches()) { System.out.println(“JavaFree Rox”); } else { System.out.println(“Hum..?”); }

O exemplo acima poderia, ainda, ser feito somente com o uso do método boolean
matches(String regex, CharSequence entrada) da classe Pattern, da seguinte
forma:


1. if (Pattern.matches("Java*", "JavaFree"))
2. {
3. System.out.println("JavaFree Rox");
4. }
5. else
6. {
7. System.out.println("Hum..?");
8. }

if (Pattern.matches(“Java*”, “JavaFree”)) { System.out.println(“JavaFree Rox”); } else { System.out.println(“Hum..?”); }

Estes exemplos mostram que é bem fácil trabalhar com expressões regulares em Java.

5. Exemplo: Validar um Endereço de Email

Fica bem simples, agora, validar um endereço de email (ou outro dado qualquer).


1. /* Exemplo prático
2. *
3. * Verifica se um endereço de email é válido
4. *
5. * Compilar: javac ValidarEmail.java
6. * Executar: java ValidarEmail [url="mailto:teste@meuemail.com"]teste@meuemail.com[/url]
7. */
8.
9. // --------------------------------------------------------------- classes nativas
10. import java.util.regex.*;
11.
12. // --------------------------------------------------------------- nossa classe
13. class ValidarEmail
14. {
15. public static void main (String[] args)
16. {
17. if (args.length < 1) // Falta argumentos de execução
18. {
19. System.out.println("Uso: java ValidarEmail ");
20. }
21. else
22. {
23. // Email válido é na forma [url="mailto:usario@endereco.com"]usario@endereco.com[/url] , [url="mailto:usario@endereco.com.br"]usario@endereco.com.br[/url], etc.
24. // Tente fazer um expressão mais restringente :D
25. Pattern padrao = Pattern.compile(".+@.+\\.[a-z]+");
26.
27. Matcher pesquisa = padrao.matcher(args[0]);
28.
29. if (pesquisa.matches())
30. {
31. System.out.println("O email " + args[0] + " eh valido!");
32. }
33. else
34. {
35. System.out.println("O email " + args[0] + " nao eh valido!");
36. }
37. }
38. }//end main()
39. }//ValidarEmail.class

Vale sempre estudar a documentação das classes. O exemplo dado aqui é bem trivial,
exitem mais métodos com outras funcionalidade muito boas no pacote.

6. Referências

[1] Sun Microsystems Inc, The Java[tm] Tutorial Lesson: Regular Expressions
[java.sun.com/docs/books/tutorial]
[2] JARGAS, Aurélio Marinho, EXPRESSÕES REGULARES
[guia-er.sourceforge.net/guia-er.html#toc1, 25 abr, 2003]
[3] SHAH, Hetal C. , Regular Expressions in J2SE [onjava.com, 26 nov, 2003]

Até o próximo,

Tadeu R. A. Santos



2 Responses to “Introdução a Expressões Regulares com Java”  

  1. 1 Renato

    Muito bom!
    Nesse site tem uma dica de uma ferramenta para testar expressões regulares para Windows:

    http://www.bernabauer.com/testador-de-expressoes-regulares/


  1. 1 Dica de blog « do software

Leave a Reply