Question 1

Devo usar regex para válidar URLs ou apenas para corresponder?

Accepted Answer

Regex é mais adequado para extrair ou corresponder URLs em texto do que para válidação rigorosa. A especificação de URL (RFC 3986) e complexa o suficiente para que um regex completo tenha centenas de caracteres e ainda assim perca casos extremos como endereços IPv6 entre colchetes. Para válidação em JavaScript, 'new URL(input)' é mais confiavel: ele lança exceção em URLs inválidas e normaliza o resultado. Use regex quando precisar encontrar URLs dentro de texto de formato livre; use o construtor URL quando precisar válidar um único valor de entrada.

Question 2

E URLs de localhost e endereços IP?

Accepted Answer

O padrão nesta página exige pelo menos um ponto no host, o que significa que não corresponde a 'http://localhost' ou endereços IP nus como 'http://192.168.1.1'. Para adicionar suporte a localhost, você pode alterar o segmento do host para '([\w\-]+(\.[\w\-]+)*)(:\d+)?'. Para endereços IP, você precisa de uma alternancia separada. Se precisar corresponder tanto nomês de domınio quanto IPs, considere dividir em dois padrões ou usar o construtor URL para analisar a entrada primeiro.

Question 3

Como correspondo a URLs que incluem strings de consulta e fragmentos?

Accepted Answer

O grupo final neste padrão cobre strings de consulta e fragmentos: '([\w.,@?^=%&:/~+#\-]*[\w@?^=%&/~+#\-])?'. A classe de caracteres inclui '?', '=', '&', '#' e '%', que cobre a maioria da sintaxe de consulta e fragmento. Um problema comum e '&' em código fonte HTML: se você estiver extraindo URLs de HTML bruto, o analisador pode ja ter codificado '&' como '&', então seu regex precisa considerar ambas as formas.

Question 4

Por que usar regex quando o construtor URL existe?

Accepted Answer

O construtor URL só válida uma única string discreta. Ele não pode extrair varias URLs de um bloco de texto, encontrar URLs incorporadas em arquivos de log ou corresponder URLs dentro de markdown. Regex preenche essa lacuna. Um fluxo de trabalho prático: use regex para extrair candidatos a URL do texto, depois passe cada candidato para 'new URL()' para verificar se ele e analisado corretamente. Issó oferece a flexibilidade do regex para extração é a correção do analisador de URL do navegador para válidação.

Segmento	Padrão	O que corresponde
Protocolo	`https?:\/\/`	`http://` ou `https://`
Host	`[\w\-]+(\.[\w\-]+)+`	Nome de domınio com pelo menos um ponto (ex. `example.com`, `sub.domain.co.uk`)
Caminho, consulta, fragmento	`([\w.,@?^=%&:/~+#\-]*[\w@?^=%&/~+#\-])?`	Caminho opcional e string de consulta, não deve terminar em caractere de pontuação

Padrão Regex de URL: Validação de URL

Ferramentas Relacionadas

Padrão Regex de URL

Detalhamento do Padrão

O Construtor URL como Alternativa de Validação

Casos Extremos que o Padrão Não Cobre

Extraindo URLs de Texto