Verschil tussen Semi Join en Bloom Word lid van

Anonim

Semi Join vs Bloom Wordt lid van

Semi join en Bloom join zijn twee verbindingsmethoden die worden gebruikt bij de verwerking van vragen voor gedistribueerde databases. Bij het verwerken van zoekopdrachten in gedistribueerde databases moet gegevens overgebracht worden tussen databases die op verschillende sites zijn gevestigd. Dit kan een dure operatie zijn, afhankelijk van de hoeveelheid gegevens die moeten worden overgedragen. Bij het verwerken van query's in een gedistribueerde databasemilieu is het daarom belangrijk om de query's te optimaliseren om de hoeveelheid gegevens die tussen websites worden overgedragen te minimaliseren. Semi join en blom join zijn twee methoden die kunnen worden gebruikt om de hoeveelheid dataoverdracht te verminderen en efficiënte query processing uit te voeren.

Wat is Semi Join?

Semi join is een methode die wordt gebruikt voor efficiënte query processing in een gedistribueerde database omgeving. Overweeg een situatie waarin een werknemer database (informatie zoals de naam van de werknemer, het departement nummer waaraan zij werkt, enz.) Op locatie 1 en een afdeling database (informatie zoals afdeling nummer, afdeling naam, locatie, enz.) 2. Als we bijvoorbeeld de naam en de afdeling van de medewerker willen vinden waarnaar zij werkt (alleen van afdelingen in "New York"), door een query te doen op een query-processor op locatie 3, zijn er verschillende manieren waarop gegevens kunnen worden overgedragen tussen de drie sites om deze taak te bereiken. Maar bij het overbrengen van gegevens is het belangrijk om op te merken dat het niet nodig is om de hele database tussen de sites over te dragen. Alleen sommige van de attributen (of tuples) die nodig zijn voor de join moeten overgebracht worden tussen de sites om de query efficiënt uit te voeren. Semi join is een methode die kan worden gebruikt om de hoeveelheid gegevens die tussen de sites worden verzonden te verminderen. In semi-join wordt alleen de joinkolom van de ene naar de andere plaats overgebracht en dan wordt de overgebrachte kolom gebruikt om de grootte van de verzonden relaties tussen de andere sites te verminderen. Voor het bovenstaande voorbeeld kunt u gewoon het departementnummer en de afdelingnaam van tuples met locatie = "New York" van site 2 naar site 1 overbrengen en de toetreding uitvoeren op site 1 en de definitieve relatie overbrengen naar site 3.

Wat is Bloom Join?

Zoals eerder vermeld, is blom join een andere methode om te voorkomen dat overbodige data tussen sites wordt vervoerd bij het uitvoeren van zoekopdrachten in een gedistribueerde database omgeving. In blom join, in plaats van de join kolom zelf over te dragen, wordt een compacte weergave van de join kolom overgebracht tussen de sites. Bloom join maakt gebruik van een bloomfilter dat een beetje vector gebruikt om lidmaatschapsvragen uit te voeren. Ten eerste wordt een bloomfilter gebouwd met behulp van de join kolom en het wordt overgebracht tussen de sites en vervolgens worden de verbindingswerkzaamheden uitgevoerd.

Wat is het verschil tussen Semi Join en Bloom Join?

Alhoewel zowel semi-join als bloom join-methoden worden gebruikt om de hoeveelheid data die tussen de sites worden overgedragen bij het uitvoeren van zoekopdrachten in een gedistribueerde databasemilieu, te minimaliseren, wordt de hoeveelheid gegevens (aantal getallen) overgedragen vergeleken met de semi-join verlaagd. door gebruik te maken van het concept bloei filters, die een beetje vector gebruiken om vastgestelde lidmaatschappen te bepalen. Dus met behulp van een bloei join zal efficiënter zijn dan het gebruik van semi join.