Desliza para mostrar el menú

En determinadas situaciones, se requiere un índice para buscar información de manera eficiente, pero utilizar un índice B-tree puede resultar demasiado complejo y redundante. En estos casos, un índice hash puede ser una alternativa más adecuada.

Un índice hash es un tipo de índice de base de datos que utiliza una función hash para mapear los valores indexados a ubicaciones en una tabla hash.
En este tipo de índice, los valores de la columna objetivo se hashean, es decir, se transforman en un valor de tamaño fijo o código hash, que luego se utiliza como índice para recuperar las filas de datos.

¿Cómo funciona?

En un índice hash, el proceso de hash implica transformar el valor de la clave del índice en un código hash mediante una función hash. Este código hash se utiliza para determinar la ubicación, o bucket, donde se almacena la información correspondiente en el índice.

Consideremos un índice hash para un sistema de catálogo de biblioteca donde cada título de libro está indexado por su ISBN (International Standard Book Number).

En este ejemplo, se utiliza una función hash para convertir el ISBN de un libro en un código hash hexadecimal, como 0x7FA4, mediante una serie de operaciones matemáticas sobre los dígitos del ISBN.
Este código hash actúa como un identificador único, determinando la posición dentro de la tabla hash donde existe un enlace a la línea correspondiente en la tabla, que contiene toda la información sobre ese libro en particular.

Características clave

Búsqueda rápida: los índices hash proporcionan búsquedas rápidas para comparaciones de igualdad. Al buscar un valor específico, PostgreSQL calcula el hash del valor y accede directamente a la ubicación correspondiente en el índice, lo que hace que la recuperación sea muy eficiente;
Soporte limitado de operadores: a diferencia de los índices B-tree, los índices hash solo admiten comparaciones de igualdad (=), no consultas de rango (<, >, <=, >=) ni ordenamiento. Esta limitación hace que los índices hash sean menos versátiles en comparación con los índices B-tree;
Mayor velocidad en algunos casos de uso: en escenarios donde la carga de trabajo implica un alto volumen de búsquedas por igualdad, como la aplicación de claves primarias o restricciones de unicidad, los índices hash pueden superar en rendimiento a los índices B-tree. Sin embargo, su ventaja de rendimiento disminuye en consultas de rango o con datos que no se adaptan bien al algoritmo de hash.

Implementación

Podemos implementar un índice hash en SQL usando la siguiente instrucción:

CREATE INDEX hash_index_name ON table_name USING HASH (column_name1, column_name2,... );

Como resultado, los valores de column_name1, column_name2,... serán hasheados y se creará la tabla hash. Esto permitirá una recuperación más rápida de las filas de datos requeridas.

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Indexación Hash