区块链研究实验室|关于数据代币与数据访问控制权限的设想

论坛 期权论坛 期权     
区块链研究实验室   2019-12-30 08:02   930   0
今日数据保管方式

数据泄露被认为是正常的。

2017年,Equifax被黑了。1.48亿人的信用卡信息被盗,包括客户名称,社会保险号,生日和地址。Equifax必须为数据泄露支付7亿美元的罚款。2012年,有1.67亿个LinkedIn帐户被盗,从而可以访问每个用户的密码。雅虎在2016年发生了数据泄露事件。Facebook在2018年发生了数据泄露事件。几乎每周我们都会听到另一起数据泄露事件。他们已经成为常态。根据Wikipedia的数据,到2020年,数据泄露的平均成本估计大于1.5亿美元,而全球年度成本预测为2.1万亿美元。

是否不可以阻止事情的发生呢?

这是一个关于数据托管的挑战——如何访问数据,以及更有效的进行数据管理,包括访问如何从一个实体转移到另一个实体。



数据托管状态



让我们思考一下在典型的初创企业中如何管理客户数据。它通常存储在一些数据库中,比如MongoDB,存储在云中。任何软件开发人员都可以在软件开发过程中随时访问这些数据。市场营销人员将使用这些数据来了解客户增长率等关键绩效指标。如果黑客可以入侵到任何开发者或营销者的帐户,他们可以访问初创公司的所有客户数据。

现在想象一下,创业公司发展得非常好。就像刚开始时有40,000个客户,然后以十年的速度呈指数增长,获得了超过10亿的用户一样。这是Facebook。想象一下,所有开发人员和市场营销人员仍然可以访问这些数据。这也是Facebook:即使Facebook拥有超过10,000名员工,几乎所有员工都可以访问所有客户数据。如果黑客入侵了任何员工的帐户,则黑客可以访问所有Facebook用户的信息。

对于运行“企业级”数据软件的老企业来说,并不一定会更好。 我们怎么知道? 这些公司也经常遭到黑客攻击。

这是一个心理模型,用于描述正在发生的事情。数据托管和管理的传统安全模型是“ M&M”模型。外面有一个硬糖壳来固定钥匙。如果有人刺破了壳的任何部分,他们就可以接触到里面的所有巧克力。情况只会越来越糟:现代的AI系统需要更多的数据,从而扩大了数据系统的范围,使攻击面更大。



未来的数据托管?


代币数据托管

让我们看看是否可以改善数据安全性。考虑一个与“ M&M”相反的思维模型:一个坚硬的中心用来握住钥匙,周围具有更具延展性的基础设施。那就是区块链的想法;坚如磐石的中心是交易列表,可在数十至数千个实体中复制数十,数百甚至数千次。事务可以保存访问控制信息。

然后,让我们考虑对数据访问进行代币化,以便可以将数据访问作为代币进行传输。实际上,在传统的数据访问代币(请考虑OAuth 2.0)。 但是“代币”只是一个字符串,“转移”基本上就是复制和粘贴该字符串。这很难保证安全。

因此,这些现有的数据访问代币不是我们在区块链领域中想到的“代币”。 但是,如果他们是呢?区块链代币表示持有私钥,这暗示所有权。您的私钥就是您的代币。

具体来说,请考虑是否ERC721“不可替代代币”(NFT)持有控制数据访问的信息。如果您拥有此“数据代币”,则可以访问数据集。如果您有数据代币,则可以托管该数据。



数据令牌变异



以下是数据代币(数据访问代币)的一些变异:

  • 访问可以是永久性的(您可以随意访问多次),也可以是一次(访问后,代币将被烧毁)。
  • 数据访问始终被视为数据服务。这可以是访问静态数据集(例如单个文件)或动态数据集(流)的服务。
  • 在返回结果数据集之前,数据服务可能具有计算元素。在这种情况下,它看起来仍然像是数据访问代币。


除代币之外,还有多种变异可用于数据访问。这些包括:

  • 读取与写入等访问。本文重点介绍“读取”访问权限。但是有一些变体:Unix风格(读,写,执行;对于个人,组,全部);数据库样式(CRUD:创建,读取,更新,删除)或区块链数据库样式(CRAB:创建,读取,追加,刻录)。
  • 用于访问计算服务的代币(例如“将计算引入数据”)。
  • 数据本身的物理表现形式(例如每个数据复制一个代币)和计算的物理表现形式(例如一个CPU分钟内一个代币)。在许多情况下,硬件资源的位置以及硬件功能的影响很大。


数据代币和许可证

拥有物理访问数据的代币意味着有权访问数据。我们可以对此权利进行形式化:数据代币通常具有使用该数据的许可证。特别是:数据将受版权保护(一种知识产权或IP形式),作为物理存储设备上位的体现。许可证是使用特定形式的IP的合同。或者可以将保留在防火墙后面的数据视为商业秘密。

数据访问传输

代币的托管意味着转让代币的权利(除非另有说明)。使用NFT,您只需将代币发送给Alice,即可将数据访问权限转移到Alice。确切地说,如果您的加密钱包中有基于NFT的数据代币,则只需按“发送”按钮,选择要发送到的地址,然后进行确认。而已!

NFT附带了数据许可证,这意味着接收者也具有访问数据的合法权利。

简而言之:数据传输=代币传输。



数据转移?




考虑以下场景。

1. Alice有一个数据代币X,用于永久访问静态数据集X。她下载了该数据集。2. Alice将代币转让给Bob。然后,Bob下载数据集。3. 但是Alice仍然拥有数据集。

这可能被视为一个问题:数据已“转移”,因为Alice仍然保留了数据,尽管不再拥有代币。但是以下每个方面都以其自己的方式解决了此问题。

1. 许可(Licensing)Alice可能持有数据的位置,但她不再持有使用它的许可权利,当然不是为了盈利。相比之下,想象一下你有一本《波希米亚狂想曲》,也就是说,你拿着那些碎片信息。你不能任意变卖,因为你没有得到许可。如果你忽视了这一点并将其出售,甚至未经允许上传,你很可能会收到代表艺术家权利的律师的来信。2. 一次性访问(One-time access )(相对于永久访问)。只有Alice可以一次使用该代币访问数据。许可证将反映这一点。3. 动态访问(Dynamic access)(相对于静态)。最有价值的数据是最新的数据。Alice转移代币后,她将不再有权访问最有价值的数据。4. 将计算引入数据(Bring compute to the data)。数据永远不会被删除为前提。因此该数据被视为商业秘密。在这里列出的选项中;但它需要更多的设置和开销。5. 可转让(Transferable )(与否)。正如出于安全考虑,像机票通常不可转让一样,对于特定类型的数据也是如此。



您的密钥就是您的数据



安德烈亚斯·安东诺普洛斯(Andreas Antonopoulos)流行一句话:“您的密钥就是您的比特币。不是您的密钥就不是您的比特币” 。也就是说,要真正拥有您的比特币,您需要拥有它的密钥。 对于代币而言,拥有密钥意味着拥有这些代币。这会影响到数据:

也就是说,要真正拥有您的数据,您需要拥有它的密钥。 持有数据代币时,您具有数据的密钥(NFT的私钥,后者又可以访问数据)和数据的许可证。



数据代币托管的基础架构



用于数据托管的代币钱包

一旦我们有数据标记作为Erc20或Erc721代币,就可以利用现有的加密代币基础结构。该基础架构可以直接用于数据托管。

移动和PC钱包。有数十个用于ERC20代币的软件钱包,至少有十二个用于ERC721代币的软件钱包。例如TrustWallet同时拥有ERC20和ERC721代币存储功能,其版本可在PC直接使用,iOS和Android中运行。它支持10个以上的网络,包括以太坊和POA.Network。通过GitHub拉取请求将代币添加到TrustWallet团队。

或者用户可以通过提供自定义网络的url和代币在网络上的(基于以太坊的)智能合约地址,获得Metamask以支持任意ERC20代币。

考虑将数据代币存放在比特币,以太坊和诸如CryptoKitties和MetaCartel之类的不可替代物品旁边的TrustWallet中。

硬件钱包,Trezor,Ledger等提供硬件钱包。在这些钱包中,私钥位于钱包内;永远不会丢失。钱包使用密钥在钱包内签署交易。只有已签名的交易离开钱包。这样可以使私钥更安全,从而令代币更安全。

下图显示了Riddle&Code提供的代币托管解决方案的示例,该解决方案面向企业的代币管理。这些相同的企业可以使用这些相同的钱包进行数据保管。比希望系统管理员和数十名其他有权访问该数据的员工不会泄露宝贵的私有数据要安全得多。






多方数据代币托管



多签名数据钱包。像Gnosis Safe这样的钱包具有“多重签名”功能,n个参与者中的m个需要签署交易才能通过。这可以用于管理公司中的宝贵数据。例如某些关键数据可能是公司5位高管中5位多重签名中的3位。其他时间可能是5个multisig中的1个,需要任何主管人员的签字。

数据DAO。我们如何将“多方”数据托管扩展到成百上千个方,在这些方中,对数据的管理可能比“ n中的n”更复杂。DAO(分散式自治组织)是一条有前途的道路。DAO可以协调全球许多人(例如传统的在线社区),但它们也可以管理资源(例如传统的公司)。在这里,由成百上千的人运行的DAO可以“拥有”数据令牌。称之为“数据DAO”。DAO将管理数据令牌:要获取的令牌,要持有的令牌以及要出售/许可的代币。杰出的DAO创建工具包括Aragon和DAOstack;还有更多的轻量级DAO,例如MolochDAO及其衍生版本,例如MetaCartel。

数据代币保管的其他方法

网络浏览器。Brave的浏览器具有内置的加密钱包。有了数据代币,它将成为安全的场所数据托管工具。

人工智能/数据科学工具。现在有用于数据科学的集成开发环境(IDE),例如Azure ML Studio。这些可能具有内置的钱包,用于保存和传输用于训练数据,作为数据的模型等的数据代币。甚至具有非图形界面的工具也可以与代币钱包集成。例如与Web3钱包集成的TensorFlow python库。

第三方监护权。就像有些人喜欢让传统的银行来保存他们的钱,或者像Coinbase这样的人来持有他们的代币一样,数据代币可以由专门从事令牌或数据代币存储的第三方持有,称为这些数据库。优点是如果丢失了密钥,恢复可能更容易。当然,信任这些第三方也是不利的(不是您的密钥,不是您的数据..)。

自定义钱包,已针对数据进行了调整。上面的示例直接使用现有的钱包基础结构。还有很大的空间来制作自定义数据钱包,例如从头开始或从头开始,以解决数据代币的特定功能。例如:

  • 长尾数据代币。某人可能拥有成千上万的数据集。您如何管理这些?
  • 数据集的可视化。钱包可能具有内置的数据浏览功能。


代币保管不断提高-就像每个人和公司的银行级安全保护一样。 使用标记化的数据,数据托管将能够继承所有出现的改进。



数据代币使用



数据代币很自然地适用于Ocean Protocol,因为Ocean已经有了使用区块链基础设施对数据服务进行访问控制的机制。

这是在Ocean Protocol中实现数据代币的高级方法。每个数据服务都有其自己的分散标识符(DID),该标识符可解析为其DID描述符对象(DDO)中DID的元数据。因此,诀窍是通过将DID放入NFT的元数据字段来将NFT与DID关联。

还值得指出的是,即使技术成熟,仅基于区块链的数据访问托管/数据代币也无法解决数据泄露问题。但是这可能会有所帮助,就像用于金融资产托管的区块链技术有所帮助一样。



结 论


在本文中,我们描述了数据泄露如何变得司空见惯,因为攻击面非常广泛。然后我们描述了区块链如何减少攻击面;以及数据代币的特定作用。然后,我们描述了基于代币的数据托管的变异,例如硬件钱包,多签名钱包,甚至是数据DAO。数据代币将是Ocean Protocol令人兴奋的方面。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:6
帖子:5
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP