Diferença Entre Semi Join e Bloom Participe

Anonim

Juntar-se Junção vs Bloom Participe

Jun join e Bloom join são dois métodos de junção usados ​​no processamento de consultas para bancos de dados distribuídos. Ao processar consultas em bancos de dados distribuídos, os dados precisam ser transferidos entre bancos de dados localizados em diferentes sites. Esta pode ser uma operação cara dependendo da quantidade de dados que precisa ser transferida. Portanto, ao processar consultas em um ambiente de banco de dados distribuído, é importante otimizar as consultas para minimizar a quantidade de dados transferidos entre os sites. A junção Semi Join e Bloom são dois métodos que podem ser usados ​​para reduzir a quantidade de transferência de dados e executar um processamento eficiente de consultas.

O que é Semi Join?

Semi join é um método usado para o processamento eficiente de consultas em ambientes de banco de dados distribuídos. Considere uma situação em que um banco de dados do funcionário (contendo informações como o nome do funcionário, o número do departamento para o qual ela está trabalhando, etc.) localizado no site 1 e um banco de dados do Departamento (contendo informações como número do departamento, nome do departamento, localização, etc.) localizados no site 2. Por exemplo, se quisermos obter o nome do funcionário e o nome do departamento pelo qual ela está trabalhando (somente dos departamentos localizados em "Nova York"), executando uma consulta em um processador de consulta localizado no site 3, existem várias formas Os dados podem ser transferidos entre os três sites para alcançar essa tarefa. Mas ao transferir dados, é importante notar que não é necessário transferir todo o banco de dados entre os sites. Somente alguns dos atributos (ou tuplas) que são necessários para a união precisam ser transferidos entre os sites para executar a consulta de forma eficiente. Semi Join é um método que pode ser usado para reduzir a quantidade de dados enviados entre os sites. Em semi-união, apenas a coluna de junção é transferida de um site para o outro e, em seguida, essa coluna transferida é usada para reduzir o tamanho das relações enviadas entre os outros sites. Para o exemplo acima, você pode simplesmente transferir o número do departamento e o nome do departamento de tuplas com a localização = "Nova York" do site 2 para o site 1 e executar a junção no site 1 e transferir a relação final para o site 3.

O que é Bloom Join?

Como mencionado anteriormente, bloom join é outro método usado para evitar a transferência de dados desnecessários entre os sites ao executar consultas em ambientes de banco de dados distribuídos. Em vez de transferir a própria coluna de junção, uma representação compacta da coluna de junção é transferida entre os sites. Bloom join usa um filtro bloom que emprega um pequeno vetor para executar consultas de membros. Em primeiro lugar, um filtro de flor é construído usando a coluna de junção e é transferido entre os sites e as operações de junção são realizadas.

Qual a diferença entre a Junção Semi e Bloom Join?

Embora os métodos de união de semi-junção e bloom sejam usados ​​para minimizar a quantidade de dados transferidos entre os sites ao executar consultas em um ambiente de banco de dados distribuído, a união de blooms reduz a quantidade de dados (número de tuplas) transferidas em comparação com semi-união utilizando o conceito de filtros de floração, que empregam um vetor de bits para determinar as associações definidas. Portanto, usar bloom join será mais eficiente do que usar semi join.