Crowdsourcing driven truthful data collection methods for wireless nodes in enterprise networks
Javed, Zunera (2024-01-29)
Javed, Zunera
Oulun yliopisto
29.01.2024
https://rightsstatements.org/vocab/InC/1.0/
© University of Oulu, 2024. This publication is copyrighted. You may download, display and print it for your own personal use. Commercial use is prohibited. © Oulun yliopisto, 2024. Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
https://rightsstatements.org/vocab/InC/1.0/
© University of Oulu, 2024. This publication is copyrighted. You may download, display and print it for your own personal use. Commercial use is prohibited. © Oulun yliopisto, 2024. Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
https://rightsstatements.org/vocab/InC/1.0/
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202312183902
https://urn.fi/URN:NBN:fi:oulu-202312183902
Kuvaus
Academic dissertation to be presented with the assent of the Doctoral Programme Committee of Information Technology and Electrical Engineering of the University of Oulu for public defence in the OP auditorium (L10), on 5 February 2024, at 12 noon
Tiivistelmä
Abstract
Driven by cloud-managed resource allocation solutions, enterprise wireless networks are undergoing profound changes. Moreover, for the sixth generation (6G) of wireless networks, machine learning- (ML) -driven algorithms have shown to bring intelligence to the networks by enabling a shift from reactive-/incident-driven network operations to proactive/data-driven network operations. The potential benefits of leveraging ML techniques for resource allocation in future enterprise wireless networks comes with a set of challenges. For an ML technique, network key performance indicator (KPI) data works as a fuel that powers the ML algorithm. ML models learn the characteristics of a system using the network data. Collecting accurate and reliable wireless resource utilization KPI data, such as wireless channel utilization (CU), through crowdsourcing from numerous independent entities operating in an enterprise wireless network is a challenging task. In this thesis, to address the challenge of reliable and accurate data collection from strategic wireless agents deployed in enterprise networks, truthful reporting methods and game-theoretic mechanisms have been introduced to incentivize agents in crowd-sourced networks.
Typically, enterprise networks deployed in universities, hospitals, offices and residential buildings exhibit recurring patterns which can be exploited by agents (wireless access points) to devise non-truthful reporting strategies. Our work focuses on challenging scenarios where independent access points (APs) can utilize distribution-aware strategies to obtain higher reward payments while minimizing their cost of measurements. We design truthful reporting methods that utilize logarithmic and quadratic scoring rules for reward payments to the APs. We show that when measurement computation costs are considered, then under certain scenarios, these scoring rules no longer ensure incentive compatibility. To address this, we present a novel reward function which incorporates a distribution-aware penalty cost that charges APs for distorting reports based on recurring patterns. To address the challenge of reliable data collection against selfish deviations, we also propose a game-theoretic crowdsourcing-based wireless data collection mechanism that can be used to collect the reliable data when the APs are strategic. Unlike other game-theoretic works, it does not make an assumption that the actions of the crowdsourcing agents are known to the crowdsourcing entity. We also propose a metric that can capture the value of the data collected from APs. In the thesis, along with synthetic data, we also use real wireless data sets which were crowd sourced using multiple independent measuring/reporting devices deployed by us in the University of Oulu. Tiivistelmä
Pilvihallintaan perustuvien resurssienjakoratkaisujen ajamana yritysten langattomat verkot ovat läpikäymässä merkittäviä muutoksia. Lisäksi kuudennen sukupolven (6G) langattomissa verkoissa koneoppimiseen (ML) perustuvat algoritmit ovat osoittaneet tuovansa älykkyyttä verkkoihin mahdollistamalla siirtymisen reaktiivisista / tapahtumaperusteisista verkkotoiminnoista ennakoiviin / datavetoisiin verkkotoimintoihin. ML-tekniikoiden hyödyntämisen potentiaaliset edut resurssien allokoinnissa tulevissa yritysten langattomissa verkoissa tuovat mukanaan joukon haasteita. ML-tekniikassa verkon suorituskykyindikaattorit (KPI) toimivat polttoaineena, joka ajaa ML-algoritmia. ML-mallit oppivat järjestelmän ominaisuuksia käyttämällä verkkodataa. Langattoman resurssin käytön KPI-datan, kuten langattoman kanavankäytön (CU), kerääminen lukuisista yritysverkossa toimivista itsenäisistä tahoista joukkoistamisen/crowdsourcingin avulla on haastava tehtävä. Tässä väitöskirjassa, jotta voidaan vastata luotettavan ja tarkan datan keräämisen haasteeseen strategisista yritysverkoissa sijoitetuista langattomista agenteista, on esitelty totuudenmukaisia raportointimenetelmiä ja peliteoreettisia mekanismeja, jotka kannustavat agentteja joukkoistetuissa verkoissa.
Tyypillisesti yliopistoissa, sairaaloissa, toimistoissa ja asuinrakennuksissa sijoitetuissa yritysverkoissa esiintyy toistuvia malleja, joita agentit (langattomat tukiasemat) voivat hyödyntää suunnitellessaan ei-rehellisiä raportointistrategioita. Työmme keskittyy haastaviin tilanteisiin, joissa itsenäiset tukiasemat (AP:t) voivat hyödyntää jakautumatietoisia strategioita saadakseen suurempia palkkioita samalla kun minimoivat mittauksiensa kustannukset. Suunnittelemme rehellisiä raportointimenetelmiä, jotka hyödyntävät logaritmisia ja neliöllisiä pisteytysääntöjä AP:eille suoritettaville palkkioille. Näytämme, että kun mittauslaskennan kustannukset otetaan huomioon, nämä pisteytysäännöt eivät tietyissä olosuhteissa enää takaa kannustinyhteensopivuutta. Tätä varten esittelemme uuden palkkiofunktion, joka sisältää jakautuma-tietoisen rangaistuskustannuksen, joka veloittaa AP:itä toistuvien mallien perusteella vääristettyjen raporttien perusteella. Luotettavan datan keräämisen haasteen ratkaisemiseksi ehdotamme myös peliteoreettisen crowdsourcing-pohjaisen langattoman datankeräysmekanismin, jota voidaan käyttää luotettavan datan keräämiseen. Toisin kuin muut peliteoreettiset työt, se ei oleta, että crowdsourcing-agenttien toimet ovat crowdsourcing-entiteetin tiedossa. Ehdotamme myös mittaria, joka kuvaa AP:iltä kerätyn datan arvoa. Väitöskirjassa käytämme myös synteettisten datojen lisäksi todellista dataa, jotka on hankittu käyttämällä useita itsenäisiä mittaus-/raportointilaitteita, jotka sijoitimme Oulun yliopistoon.
Driven by cloud-managed resource allocation solutions, enterprise wireless networks are undergoing profound changes. Moreover, for the sixth generation (6G) of wireless networks, machine learning- (ML) -driven algorithms have shown to bring intelligence to the networks by enabling a shift from reactive-/incident-driven network operations to proactive/data-driven network operations. The potential benefits of leveraging ML techniques for resource allocation in future enterprise wireless networks comes with a set of challenges. For an ML technique, network key performance indicator (KPI) data works as a fuel that powers the ML algorithm. ML models learn the characteristics of a system using the network data. Collecting accurate and reliable wireless resource utilization KPI data, such as wireless channel utilization (CU), through crowdsourcing from numerous independent entities operating in an enterprise wireless network is a challenging task. In this thesis, to address the challenge of reliable and accurate data collection from strategic wireless agents deployed in enterprise networks, truthful reporting methods and game-theoretic mechanisms have been introduced to incentivize agents in crowd-sourced networks.
Typically, enterprise networks deployed in universities, hospitals, offices and residential buildings exhibit recurring patterns which can be exploited by agents (wireless access points) to devise non-truthful reporting strategies. Our work focuses on challenging scenarios where independent access points (APs) can utilize distribution-aware strategies to obtain higher reward payments while minimizing their cost of measurements. We design truthful reporting methods that utilize logarithmic and quadratic scoring rules for reward payments to the APs. We show that when measurement computation costs are considered, then under certain scenarios, these scoring rules no longer ensure incentive compatibility. To address this, we present a novel reward function which incorporates a distribution-aware penalty cost that charges APs for distorting reports based on recurring patterns. To address the challenge of reliable data collection against selfish deviations, we also propose a game-theoretic crowdsourcing-based wireless data collection mechanism that can be used to collect the reliable data when the APs are strategic. Unlike other game-theoretic works, it does not make an assumption that the actions of the crowdsourcing agents are known to the crowdsourcing entity. We also propose a metric that can capture the value of the data collected from APs. In the thesis, along with synthetic data, we also use real wireless data sets which were crowd sourced using multiple independent measuring/reporting devices deployed by us in the University of Oulu.
Pilvihallintaan perustuvien resurssienjakoratkaisujen ajamana yritysten langattomat verkot ovat läpikäymässä merkittäviä muutoksia. Lisäksi kuudennen sukupolven (6G) langattomissa verkoissa koneoppimiseen (ML) perustuvat algoritmit ovat osoittaneet tuovansa älykkyyttä verkkoihin mahdollistamalla siirtymisen reaktiivisista / tapahtumaperusteisista verkkotoiminnoista ennakoiviin / datavetoisiin verkkotoimintoihin. ML-tekniikoiden hyödyntämisen potentiaaliset edut resurssien allokoinnissa tulevissa yritysten langattomissa verkoissa tuovat mukanaan joukon haasteita. ML-tekniikassa verkon suorituskykyindikaattorit (KPI) toimivat polttoaineena, joka ajaa ML-algoritmia. ML-mallit oppivat järjestelmän ominaisuuksia käyttämällä verkkodataa. Langattoman resurssin käytön KPI-datan, kuten langattoman kanavankäytön (CU), kerääminen lukuisista yritysverkossa toimivista itsenäisistä tahoista joukkoistamisen/crowdsourcingin avulla on haastava tehtävä. Tässä väitöskirjassa, jotta voidaan vastata luotettavan ja tarkan datan keräämisen haasteeseen strategisista yritysverkoissa sijoitetuista langattomista agenteista, on esitelty totuudenmukaisia raportointimenetelmiä ja peliteoreettisia mekanismeja, jotka kannustavat agentteja joukkoistetuissa verkoissa.
Tyypillisesti yliopistoissa, sairaaloissa, toimistoissa ja asuinrakennuksissa sijoitetuissa yritysverkoissa esiintyy toistuvia malleja, joita agentit (langattomat tukiasemat) voivat hyödyntää suunnitellessaan ei-rehellisiä raportointistrategioita. Työmme keskittyy haastaviin tilanteisiin, joissa itsenäiset tukiasemat (AP:t) voivat hyödyntää jakautumatietoisia strategioita saadakseen suurempia palkkioita samalla kun minimoivat mittauksiensa kustannukset. Suunnittelemme rehellisiä raportointimenetelmiä, jotka hyödyntävät logaritmisia ja neliöllisiä pisteytysääntöjä AP:eille suoritettaville palkkioille. Näytämme, että kun mittauslaskennan kustannukset otetaan huomioon, nämä pisteytysäännöt eivät tietyissä olosuhteissa enää takaa kannustinyhteensopivuutta. Tätä varten esittelemme uuden palkkiofunktion, joka sisältää jakautuma-tietoisen rangaistuskustannuksen, joka veloittaa AP:itä toistuvien mallien perusteella vääristettyjen raporttien perusteella. Luotettavan datan keräämisen haasteen ratkaisemiseksi ehdotamme myös peliteoreettisen crowdsourcing-pohjaisen langattoman datankeräysmekanismin, jota voidaan käyttää luotettavan datan keräämiseen. Toisin kuin muut peliteoreettiset työt, se ei oleta, että crowdsourcing-agenttien toimet ovat crowdsourcing-entiteetin tiedossa. Ehdotamme myös mittaria, joka kuvaa AP:iltä kerätyn datan arvoa. Väitöskirjassa käytämme myös synteettisten datojen lisäksi todellista dataa, jotka on hankittu käyttämällä useita itsenäisiä mittaus-/raportointilaitteita, jotka sijoitimme Oulun yliopistoon.
Kokoelmat
- Avoin saatavuus [38840]