Expresiones Regulares – Las Bases

Expresiones Regulares – Las Bases

Introducción

Todos los programadores de perl han usado las expresiones regulares en algun momento, ya sea para verificar si alguna variable tiene un valor deseado, o para sustituir una palabra por otra. Pero aún así son contados los programadores que REALMENTE entiendes en su máxima extensión est gran creación: las expresiones regulares.

Las expresiones regulares existen en todos los lenguajes de programación desde JAVA,c y C++ hasta el PHP,Phyton y Perl. En todos la sintaxis son muy similares exceptuando ciertos cambios en algunos caracteres.

En este tutorial vamos a ver un poco de las expresiones regulares y lo que podemos lograr con ellas, este es una breve introducción a este mundo.
Demilitador de las expresiones

Un delimitador es lo que marca el principio y el fin de una expresion regular. El delimitador que más comunmente se usa es la diagonal ‘/’:

m//;

Sin embargo este delimitador lo podemos cambiar por el que se nos pegue la gana, ya sea por una letra o algun otro símbolo:

#Delimitador !
m!expresion!;

#Delimitador =
m=expresion=;

#Delimitador –
m-expresion-;

El operador m//Este operador también conocido como de cotejo, se utiliza para localizar alguna expresión dentro de una cadena de texto o string. Si la expresión es verdadera entonces se regresará un 1.

La regla es sumamente sencilla, debes de usar el mismo delimitador para abrir y cerrar la expresión regular, y este debe de ser de un sólo caractér.
NOTA: A veces el uso de caracteres delimitadores como el + pueden hacer que tu código se difícil de leer.

Normalmente este operador es utilizado para verificar que nuestra variable tenga cierto valor. Por ejemplo:

my $string = “Mi frase no muy larga”;

if($string =~ m/frase/){
print “Se encontró la palabra: frase.\n”;
}

Al ver este pequeño pedazo de código verás un símbolo extraño “=~”. Este símbolo le dice a perl que evalue la siguiente expresión regular a verdadero, lo que significa que si el operador regresa un valor de 1 o verdadero se imprimirá el texto dentro del “if”.

Pero que pasa si quisieramos hacerlo al revés, si quisieramos checar que alguna expresión NO estuviera dentro de alguna cadena:

my $string = “Mi frase no muy larga”;

if($string !~ m/jugo/){
print “No se encontró la palabra: jugo.\n”;
}

Aquí vemos como debido a que NO se encontró la palabra “jugo” el código dentro del “if” es ejecutado.
El operador s///

Este operador que tambiés es conocido como operador de sustitución, es utilizado para sustituir alguna cadena o expresión por otra. Por ejemplo:

my $string = “Hoy es Lunes”;

$string =~ s/Lunes/Martes/;

Al correr la siguiente expresión el valor final de “$string” será de: “Hoy es Martes”.

La sintáxis de este operador, es que primero va la cadena o expresión que queremos que sea sustituido seguido por lo que queremos sustituirlo con.

Otro ejemplo de esto es:
$string = “El nombre de mi perro es: (nombre)”;

$string =~ s/\(nombre\)/Rocky/;

Si corres esta expresión te imaginaras que el resultado va a ser: “El nombre de mi perro es: Rocky”.
El operador tr///

También conocidmo como el operador de traducción nos sirve para cambiar carácteres individuales por otros. La diferencia que tienes con los otros operadores, es que este no lee variables dentro de la expresión.

my $string = “aparato”;

$string =~ tr/a/e/;

Al ejecutar este expresión el resultado va a ser: “eperete”.
Opciones de los operadores

Si alguna ves has visto expresiones regulares anteriormente, quizá te habrás dado cuenta que al final de ellas luego hay letras. Estas letras son “opciones” que le indica a perl como interpretar la expresión.

Hay varias opciones que se pueden usar, pero como esto es sólo una introducción sólo voy a poner las más usuales:

Opcion: i Este operador le dice a perl que ignore el uso de mayúscula y minúsculas. Por ejemplo:

my $string = “Palabra”;

#La siguiente expresión da falso debido a que hay una mayúscula
print “Verdadero” if $string =~ m/palabra/;

#La siguiente expresión da verdadero debido a que le decimos a perl que no nos importan las mayúsculas
print “Verdadero” if $string =~ m/palabra/i;

Opción: g

Esta opción le dice a perl que repita la sustitución durante todas las ocurrencias de la cadena. Por ejemplo:

my $string = “Lunes y otro Lunes”;

#Solo hará el remplazo al primer Lunes
$string =~ s/Lunes/Martes/;

#Hará el remplazo al todos los Lunes
$string =~ s/Lunes/Martes/g;

Opción: m

Este opción le dice a perl que la cadena que se esta evaluando es de varias lineas. Para dar más velocidad al proceso, perl hace una optimización como si estuviera evaluando una sola linea. Así que si tu cadena tiene varios “\n”, tienes que usar esta opcion para quitar esta optimización.
Meta-Secuencias

Dentro de nuestras expresiones podemos usar lo que se llaman “Meta-Secuencia”, estos son caracteres que simbolizan cosas específicas y aquí esta una lista de las más usadas.

Meta: \b

Esta meta-secuencia se usa para marcar un fin de palabra. Por ejemplo:

$string = “Mi palabara es esta.”;

#Debido a que en esta expresión se usar el fin de palabra el resultado es verdadero por “es” y no por “esta”.
print “OK” if $string =~ “\bes\b”;

Meta: \B

El contrario de la meta-secuencia anterior, esto simboliza un fin de no-palabra.

Meta: \d

Cualquier dígito (0-9). Por ejemplo:
my $string = “Numeros 12345”;

Cualquier espacio en blanco. Por ejemplo:
my $string = “Mis palabras”;

print “Hay números.” if $string =~ m/\d/;

Meta: \D

Simboliza cualquier no-digito.

Meta: \s

#Quitamos todos los espacios en blanco
$string =~ s/\s//g;

Meta: \S

Cualquier no-espacio.

Meta: \t

Cualquier tabulador.

Meta: \u

Cambia el siguiente carácter a mayúscula.

Meta: \U

Cambia los carácteres que siguen a mayúscula hasta encontrar un \E.

Meta: \l

Cambia el caracter que sigue por minúscula.

Meta: \L

Cambia los caracteres siguientes a minúsculas hasta encontrar un \E.

Meta: \w

Meta-secuencia para todos los caracteres de palabra, es decir todos los caracteres alfa-númericos y el guíon. Por ejemplo:
$string = ‘$%&·’;

print “No hay palabras” if $string !~ m/\w/;

Meta: \W

Todos los caracteres de no-palabra.
Notas Finales

Con este tutorial ya hechamos un vistazo muy amplio al mundo de las expresiones regulares, aunque aún faltan varios temas para poder manejar totalmente las expresiones regulares, pero ya será tema de otro tutorial.

mod_rewrite: Guía Básica para reescribir URLs

Hoy en día la posición en los buscadores es un factor importante en el éxito de un sitio web. También se sabe que a los buscadores no le atraen mucho los sitios dinámicos, es decir, aquellos que cambian su contenido dependiendo de diversos factores.

Por ejemplo, la mayoria de foros están en PHP por lo que los urls para navegar el foro son parecidos a esto:

http://tusitio.com/foro/viewforum.php?f=3

Y aunque los bots de los buscadores lo pueden leer e indexar en su base de datos, si ponen un penalti por ser un url dinámico. Para solucionar esto, si eres un visitante o un robot, el url que verás será:

http://tusitio.com/foro/forum-3.html

Si pruebas ambos urls verás que muestra el mismo contenido. Podrás pensar que son dos páginas distintas, pero no es así, el segundo url, el que simula una página estática, es convertido detrás de las cortinas para llamar a la página real. Así es, en mi servidor no existe un archivo forum-3.html.

En este artículo les voy a mostrar como lograr esto.

Una solución elegante

Quizá estarán pensando que todo esto es un producto de magia, pero realmente es bastante sencillo lograrlo y los resultados serán muy buenos, pues no solamente podrán dar urls estáticos a los buscadores mejorando su posición, sino que también podrán dar urls amigables a sus usuarios.

Para poder lograr esto es necesario tener lo siguiente:

* Un servidor Apache versión 1.2 o mejor.
* Acceso para editar los archivos de configuración .htaccess, y quizá de ser necesario el http.conf.

Si están acostumbrados a usar servidores Apache, lo más seguro es que en algún momento hayan escuchado acerca del módulo mod_rewrite de Apache. Normalmente este módulo viene por default en las distribuciones de Apache pero en sistemas *nix puede que haya sido compilado sin este módulo.

Para poder usar este módulo primero lo tenemos que activar. En caso de que no tengas el módulo activado tendrás que editar tu archivo http.conf y quitar el comentario de la línea que carga el módulo para que quede de la siguiente manera:

#LoadModule rewrite_module
modules/mod_rewrite.so
#AddModule mod_rewrite.c

Comprendiendo mod_rewrite

Es importante comprender lo que hace exactamente este módulo.

El mod_rewrite se ejecuta después de hacer un request en tu servidor y antes de ejecutar cualquier script. Lo que hace es que aplica un “filtro” configurado por uno sobres los urls y los rescribe detrás de las cortinas.

Por ejemplo, podrías tener un url inexistente como el siguiente:

http://www.tusitio.com/algo

Y entonces el mod_rewrite lo podría convertir a:

http://www.tusitio.com/cgi-bin/dir/aplicacion.cgi?categoria=algo

La conversión del url se hace por detrás por lo que el usuario no podrá ver nada de esto, sin embargo si verá el resultado que viene de la ejecución del url “real”.

Es importante comprender que mod_rewrite NO puede ser usado para cambiar el URL que el usuario ve es la barra de Dirección de su navegador a menos que una redirección externa es invocada. Sin embargo una dirección externa expone finalmente el url dinámico, así que mod_rewrite hace una redirección interna.

También es importante comprender que mod_rewrite cambia la dirección del archivo y las variables del url pedido pero NO cambia en ningún momento el despliegue de las mismas.

Poniendo mod_rewrite en práctica

Muy bien, empecemos con lo bueno, para esto vamos a hacer un ejemplo práctico.

Digamos que tienes una tienda de ropa y que tus clientes pueden ver la ropa que tienes navegando por categoría y talla de la misma. Para esto tienes una aplicación que se llama de la siguiente manera:

http://tusitio.com/cgi-bin/aplicacion_ropa.cgi?tipo=playeras&sexo=femenino&talla=chica

No es para nada bonito el url, por lo que queremos que nuestros clientes puedan acceder de la siguiente manera:

http://tusitio.com/playeras/femenino/chica.htm

Como ves es más intuitivo y amigable.

Usando mod_rewrite no es necesario hacer ningún cambio en tu aplicación, ni siquiera es necesario que crees los directorios ‘playeras/’ ni ‘playeras/femenino’, tampoco es necesario que hagas un archivo que se llame chica.htm.

Lo que vamos a hacer es que cuando algún usuario haga un request de ‘http://tusitio.com/playeras/femenino/chica.htm’ usaremos el mod_rewrite para filtrar y convertir el url a ‘http://tusitio.com/cgi-bin/aplicacion_ropa.cgi?tipo=playeras&sexo=femenino&talla=chica’, pero todo esto detrás de las cortinas, usando la redirección interna como habíamos dicho.

Ya que estemos seguros que tenemos el mod_rewrite instalado y activo, vamos a crear un nuevo archivo de configuración .htaccess.

Dentro de nuestro .htaccess vamos a inicializar el módulo mod_rewrite:

RewriteEngine On

Ya que tenemos esto, tenemos que configurar las reglas o filtros que vamos a usar. Cada uno deberá de ir en una nueva línea y podemos tener tantos como nosotros queramos y necesitemos.

Entonces vamos a crear nuestro filtro que ser verá así:

RewriteRule ^playeras/femenino/chica.htm cgi-bin/aplicacion_ropa.cgi?tipo=playeras&sexo=femenino&talla=chica [L,NC]

Comprendamos nuestra línea del filtro. El filtro está conformado por 4 elementos, cada uno separado por un espacio en blanco.

El primer elemento es:

RewriteRule

Aquí indicamos que estamos creando una nueva regla o filtro para la máquina de mod_rewrite. El segundo elemento es:

^playeras/femenino/chica.htm

En este caso es el url que estamos buscando. Es importante que tengamos en cuenta que siempre debemos de usar los directorio relativos, es decir, no debemos de poner el dominio de nuestro sitio, el mod_rewrite lo pondrá por nosotros.

La tercera parte es el nuevo url al cual queremos redirigir, también la dirección debe de estar relativa, mod_rewrite pondrá por nosotros el dominio de nuestro sitio.

cgi-bin/aplicacion_ropa.cgi?tipo=playeras&sexo=femenino&talla=chica

NOTA: No podemos usar el mod_rewrite para hacer una redirección interna a un url que no se encuentre dentro de nuestro dominio.

La última parte es opcional y son flags que regulan el comportamiento del mod_rewrite.

[L,NC]

En las siguientes secciones veremos más detalles acerca de los flags, pero podemos decir que con los flags L y NC le decimos al mod_rewrite que sea la última regla que cheque si coincide y que no haga caso a las minúsculas y mayúsculas.

Más poder a nuestro mod_rewrite

El ejemplo anterior es de gran ayuda, vimos como podemos convertir un url dinámico en estático en cuestión de minutos, pero hay un pequeño problema.

Lo más seguro es que nuestra tienda de ropa no venda puras playeras chicas, ni tampoco puras de mujer, y lo más seguro es que venda más productos que puras playeras, debe de haber pantalones, chamarras, shorts, camisas, vestidos, etc, etc.

Hacer una nueva regla por cada producto y por cada tamaño será un verdadero dolor de cabeza, y aparte cada ves que queramos poner una nueva línea de productos en la tienda tendremos que modificar nuestro .htaccess.

Pues bueno, con mod_rewrite podemos evitar eso, pues aún no hemos visto la parte más poderosa.

En el último ejemplo hicimos un filtro bastante sencillo:

RewriteEngine On
RewriteRule ^playeras/femenino/chica.htm cgi-bin/aplicacion_ropa.cgi?tipo=playeras&sexo=femenino&talla=chica [L,NC]

Pero también quisiéramos que los siguientes urls lo redirija al lugar correcto:

http://tusitio.com/pantalones/masculino/32.htm
http://tusitio.com/vestidos/femenino/mediano.htm
http://tusitio.com/shorts/infantil/12.htm

Si vemos, todos los urls tiene una misma sintaxis, el primer directorio sería la línea de ropa (pantalones,vestidos,shorts,etc), el subdirectorio sería el departamento (masculino,femenino,infantil,etc) y el archivo html sería la talla (32.htm,mediano.html,12.htm).

mod_rewrite nos permite usar expresiones regulares dentro de nuestros filtros, de esta manera podemos realizar filtros más poderosos.

Las expresiones regulares nos brindan un set de reglas que podemos usar para comprobar valores arbitrarios como en este caso. Sabemos que el url vendrá en una misma sintaxis pero tendrá diferentes valores, usando las expresiones regulares podemos capturar y comprobar esos valores.

Veamos la expresión regular que usaríamos en este caso para hacer lo que queremos:

^([a-zA-Z]+)/([a-zA-Z]+)/([a-zA-Z0-9]+).htm$

Expliquemos un poco nuestra expresión.

El ^ incial denota inicio de línea, significa que solamente será válida la regla si se cumple iniciando la línea.

Los paréntesis ( ) los usamos para capturar el valor, en este caso así lo queremos pues después tendremos que usarlos para enviárselos a nuestro CGI de la aplicación.

Los [ ] los usamos para asignar un campo de caracteres. Los campos de caracteres los podemos usar cuando queremos checar que ciertos caracteres estén o no estén. En la primera parte que será de la línea de ropa, sabemos que solamente vendrán letras del alfabeto, por lo que solamente queremos de la a-z y de la A-Z, en minúsculas y mayúsculas. Lo mismo en la segunda parte, pero ya en la tercera parte si puede haber números por ejemplo en 32.htm, por lo que tenemos que poner también el 0-9.

El signo de + después del cierre del campo de carácter, significa que debe de haber por lo menos uno o más de los caracteres que queremos.

Luego tenemos la separación con las diagonales ‘/’ que están fuera de los paréntesis pues queremos capturar solamente ‘pantalones’ y no ‘pantalones/’.

Al final también dejamos el .htm fuera de los paréntesis pues no lo queremos usar, y terminamos con $ que simboliza final de línea.

Así ya tenemos nuestros valores capturados que ahora podremos usar en el url para llamar al CGI de nuestra aplicación:

cgi-bin/aplicacion_ropa.cgi?tipo=$1&sexo=$2&talla=$3

Vemos como los valores los sustituimos por $1, $2, $3 que a su vez serán sustituidos por mod_rewrite con los valores que capturamos en nuestros paréntesis.

Cada paréntesis captura en una nueva variable y lo hacen en orden, así que van tomando $1, $2, $3, $4.. así hasta lo que se necesite.

Así que finalmente nuestra regla se verá de la siguiente manera:

RewriteEngine On
RewriteRule ^([a-zA-Z]+)/([a-zA-Z]+)/([a-zA-Z0-9]+).htm$ cgi-bin/aplicacion_ropa.cgi?tipo=$1&sexo=$2&talla=$3 [L,NC]

Así si llamamos a los siguientes urls:

http://tusitio.com/pantalones/masculino/32.htm
http://tusitio.com/vestidos/femenino/mediano.htm
http://tusitio.com/shorts/infantil/12.htm

Serán redireccionados internamente a:

http://tusitio.com/cgi-bin/aplicacion_ropa.cgi?tipo=pantalones&sexo=masculino&talla=32
http://tusitio.com/cgi-bin/aplicacion_ropa.cgi?tipo=vestidos&sexo=femenino&talla=mediano
http://tusitio.com/cgi-bin/aplicacion_ropa.cgi?tipo=shorts&sexo=infantil&talla=12

Así de la nada, tenemos una lista infinita de páginas estáticas fáciles de navegar por nuestros usuarios.

Tomándole la medida a mod_rewrite

Usar mod_rewrite es sumamente sencillo, quizá lo más difícil podría ser aprender a usar las expresiones regulares y los flags que podemos usar para controlar el comportamiento del módulo.

Sin embargo ambas son muy intuitivas y con un poco de uso y de estar jugando y probando con ellas, les tomarás la práctica inmediatamente.

Dave Child hizo un PDF con un “acordeón” que enlista las expresiones regulares y flags que podemos usar en el mod_rewrite. Les recomiendo que descarguen el PDF con la lista y lo tengan a la mano en el momento de crear sus filtros:
http://www.ilovejackdaniels.com/mod_rewrite_cheat_sheet.pdf

Cuando hagas tus primeras pruebas con el mod_rewrite, ten cuidado y si puedes has las pruebas con un servidor Apache que no esté en vivo, pues si tienes algún error de sintaxis al momento de crear tus filtros, verás un error 500 en todo tu sitio, evitando que tus usuarios puedan acceder a él.

Hackean una Dell Mini 9 y le ponen una pantalla táctil

No es la primera perrería que le hacen al pobre Mini 9 de Dell, pero sin duda, se trata de la más osada de todas. El usuario del foro myDellMini llamado Deldotb ha sido el artífice del milagro. Ha comprado para ello una pantalla táctil de esas que pululan por Ebay y ha cargado los drivers correspondientes para Ubuntu con el resultado que puedes ver en el vídeo un poco más abajo.

Lo malo es que ha tenido que sacrificar un valioso puerto USB para llevarlo a cabo. No te pierdas el “Hello world works!” en el vídeo.

Back in Time, copias de seguridad automáticas y periódicas en Gnome

Back in Time es una aplicación para crear copias de seguridad automáticamente integrada en el escritorio Gnome. Aunque lejos de intentar hacer frente a la espectacular interfaz y aspecto visual del Time Machine de Mac, sí implementa su funcionalidad más importante: se pueden configurar backups periódicos para después poder elegir a qué momento exacto regresar. Él solo va creando copias de seguridad (snapshots) automática y periódicamente siempre que algo haya cambiado en los directorios elegidos, de modo que después el usuario puede elegir qué copia restaurar dependiendo del momento en el que fue respaldada.

back in time

La ventana principal está distribuida de forma que en la columna de la izquierda se ve la línea de tiempo, con todas las instantáneas que se han ido tomando y su fecha. En la del centro se puede acceder a los marcadores del navegador de archivos y directorios del sistema, y en la derecha es donde realmente se navega por los archivos.

La configuración del programa permite seleccionar el directorio donde guardar los snapshots, qué directorios se quieren respaldar y qué tipo de ficheros se deben excluir de la copia de seguridad utilizando patrones de los nombres. Por ejemplo, si no se quieren respaldar los ficheros de seguridad que crea el editor de texto Gedit, sino sólo los ficheros originales, habría que añadir un patrón de exclusión *~, ya que es así como el editor los renombra siempre.

También en la ventana de preferencias se puede configurar cuándo debe Back in Time comprobar automáticamente si debe realizar una nueva copia de seguridad (manualmente, cada 5 minutos, cada día, semana, mes…). Además, tiene dos opciones más que pueden ser muy útiles: eliminar los backups que sean viejos o si el espacio en el disco empieza a ser escaso.

Link: Back in Time

Watermark Tool, incrusta marca de agua a tus imágenes

Watermak tool es una sencilla y práctica herramienta web en la que podrás subir tus imágenes, siempre que éstas no sobrepasen cada una los 100 kb de tamaño máximo permitido, para posteriormente configurar una serie de opciones de la marca de agua que deseas añadir. Estas opciones van desde el propio texto a añadir hasta la transparencia del fondo de la caja del texto.

Una vez tengas la configuración de tu marca de agua, ya sólo te queda generar el resultado. De esta manera, si simplemente quieres crear tu galería de imágenes hasta crear un banco de imágenes para su venta, Watermark tool es una sencilla aplicación específica que tendrás que tener en cuenta si deseas proteger tus imágenes.

Link: Watermarktool.com

Fuente: FeedMyApp

Nueva versión de PHP 5.2.8

Ha salido a la luz una nueva versión de php, la PHP 5.2.8, esta versión soluciona un bug encontrado en la reciente versión también publicada 5.2.7 relacionada con el funcionamiento de magic_quotes, bug de seguridad que abría un agujero de seguridad al tener activo “magic_quotes_gpc

Se recomienda actualizar a dicha versión, y si tienes la versión 5.2.7 y no deseas actualizar aplica el siguiente “parche” a tu php.ini para arreglar el problema de magic_quotes:

“filter.default_flags=0″

Más información en php.net