阅读127 返回首页    go 人物


检索数据__从 SQL 到 NoSQL_快速入门_表格存储-阿里云

SQL

SQL SELECT 语句可以查询关键列、非关键列或任意组合。WHERE 子句确定返回的行,如以下示例所示:

  1. // 根据主键查询一行
  2. SELECT * FROM UserHistory
  3. WHERE user_id = '10100' AND time_stamp = 1479265526;
  4. // 查询某个 user_id 下的所有数据
  5. SELECT * FROM UserHistory
  6. WHERE user_id = '10100';
  7. // 根据某个 user_id 下的某段时间的所有记录
  8. SELECT * FROM UserHistory
  9. WHERE user_id = '10100' AND time_stamp > 1478660726 AND time_stamp < 1479265526;
  10. // 查询某个 user_id 所有收藏的记录
  11. SELECT * FROM UserHistory
  12. WHERE user_id = '10100' AND behavior_type = 'collect';

表格存储

表格存储中的数据查询接口可以用类似的方式检索数据,单行查询 GetRow 和范围查询 GetRange 能够提供对存储数据物理位置的快速高效访问,查询的性能只受到结果数据集大小的影响,不会受到表中数据总量大小的影响。

  • 提供完整的主键信息,可以使用 GetRow 快速查询这行数据,如下所示:

    1. // SELECT * FROM UserHistory WHERE user_id = '10100' AND time_stamp = 1479265526;
    2. // 设置主键信息
    3. PrimaryKeyBuilder primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    4. primaryKeyBuilder.addPrimaryKeyColumn('user_id', PrimaryKeyValue.fromString("10100"));
    5. primaryKeyBuilder.addPrimaryKeyColumn('time_stamp', PrimaryKeyValue.fromLong(1479265526));
    6. PrimaryKey primaryKey = primaryKeyBuilder.build();
    7. // 读一行
    8. SingleRowQueryCriteria criteria = new SingleRowQueryCriteria(TABLE_NAME, primaryKey);
    9. // 设置读取最新版本
    10. criteria.setMaxVersions(1);
    11. GetRowResponse getRowResponse = client.getRow(new GetRowRequest(criteria));
  • 使用 GetRange 对某个 user_id 下所有的数据进行查询,如下所示:

    1. // 等同于 SELECT * FROM UserHistory WHERE user_id = '10100'
    2. RangeRowQueryCriteria rangeRowQueryCriteria = new RangeRowQueryCriteria(TABLE_NAME);
    3. // 设置起始主键
    4. PrimaryKeyBuilder primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    5. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.fromString("10100"));
    6. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.INF_MIN);
    7. rangeRowQueryCriteria.setInclusiveStartPrimaryKey(primaryKeyBuilder.build());
    8. // 设置结束主键
    9. primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    10. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.fromString("10100"));
    11. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.INF_MAX);
    12. rangeRowQueryCriteria.setExclusiveEndPrimaryKey(primaryKeyBuilder.build());
    13. // 设置读取最新版本
    14. rangeRowQueryCriteria.setMaxVersions(1);
    15. // 默认读取所有的属性列
    16. GetRangeResponse getRangeResponse = client.getRange(new GetRangeRequest(rangeRowQueryCriteria));

    请注意如下关键事项:

    • GetRange 需要指定所有主键的起始范围,但每个主键的范围并不是 AND 的关系,而是以第一个主键到最后一个主键为顺序,优先比较前面的主键,当前面的主键在 GetRange 起止主键范围内时,该条数据就会被读取出来。比如两个主键起止范围为 (‘a’,5)~(‘c’,10),由于 'a' < 'b' < 'c',所以主键为 (‘b’, 4) 的数据也符合要求。

    • INF_MININF_MAX 为 GetRange 操作专用类型,分别表示最小值和最大值。

    • GetRange 支持 limitdirection 来控制结果集行数和读取的顺序。

    • 为防止网络延迟,GetRange 对返回结果集进行了限制,需要对 Response 中的 next_start_primary_key 进行判断,为空时表示结果已经全部返回,不为空时需要继续读取。

    • GetRange 支持过滤器功能。

    • 表格存储支持数据多版本功能,在使用 GetRowGetRange 接口时可以指定读取属性列的历史版本范围。

  • 使用 GetRange 对某个 user_id 下某段时间范围的所有的数据进行查询,如下所示:

    1. // SELECT * FROM UserHistory WHERE user_id = '10100' AND time_stamp >= 1478660726 AND time_stamp < 1479265526;
    2. RangeRowQueryCriteria rangeRowQueryCriteria = new RangeRowQueryCriteria(TABLE_NAME);
    3. // 设置起始主键
    4. PrimaryKeyBuilder primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    5. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.fromString("10100"));
    6. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.fromLong(1478660726));
    7. rangeRowQueryCriteria.setInclusiveStartPrimaryKey(primaryKeyBuilder.build());
    8. // 设置结束主键
    9. primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    10. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.fromString("10100"));
    11. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.fromLong(1479265526));
    12. rangeRowQueryCriteria.setExclusiveEndPrimaryKey(primaryKeyBuilder.build());
    13. // 设置读取最新版本
    14. rangeRowQueryCriteria.setMaxVersions(1);
    15. // 默认读取所有的属性列
    16. GetRangeResponse getRangeResponse = client.getRange(new GetRangeRequest(rangeRowQueryCriteria));

    该查询等同于:

    1. SELECT * FROM UserHistory
    2. WHERE user_id = '10100' AND time_stamp > 1478660726 AND time_stamp < 1479265526;
  • 如果需要继续对属性列做条件查询,可以使用 过滤器功能, 如下查询某个 user_id 下某所有的收藏记录:

    1. // SELECT * FROM UserHistory WHERE user_id = '10100' AND behavior_type = 'collect';
    2. RangeRowQueryCriteria rangeRowQueryCriteria = new RangeRowQueryCriteria(TABLE_NAME);
    3. // 设置起始主键
    4. PrimaryKeyBuilder primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    5. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.fromString("10100"));
    6. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.INF_MIN);
    7. rangeRowQueryCriteria.setInclusiveStartPrimaryKey(primaryKeyBuilder.build());
    8. // 设置结束主键
    9. primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    10. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.fromString("10100"));
    11. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.INF_MAX);
    12. rangeRowQueryCriteria.setExclusiveEndPrimaryKey(primaryKeyBuilder.build());
    13. // 设置属性列的过滤条件: behavior_type = 'collect'
    14. SingleColumnValueFilter filter = new SingleColumnValueFilter("behavior_type", SingleColumnValueFilter.CompareOperator.EQUAL, ColumnValue.fromString("collect"));
    15. // 表格存储是 schemafree 模型,有些行不包括属性列 behavior_type
    16. // 设置为 false 表示如果该行没有属性列 behavior_type,则不满足条件条件
    17. filter.setPassIfMissing(false);
    18. rangeRowQueryCriteria.setFilter(filter);
    19. // 设置读取最新版本
    20. rangeRowQueryCriteria.setMaxVersions(1);
    21. // 默认读取所有的属性列
    22. GetRangeResponse getRangeResponse = client.getRange(new GetRangeRequest(rangeRowQueryCriteria));

    该查询等同于:

    1. SELECT * FROM UserHistory
    2. WHERE user_id = '10100' AND behavior_type = 'collect';

    当然,也可以通过如下方式来实现:

    1. // SELECT * FROM UserHistory WHERE user_id = '10100' AND behavior_type = 'collect';
    2. RangeRowQueryCriteria rangeRowQueryCriteria = new RangeRowQueryCriteria(TABLE_NAME);
    3. // 设置起始主键
    4. PrimaryKeyBuilder primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    5. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.INF_MIN);
    6. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.INF_MIN);
    7. rangeRowQueryCriteria.setInclusiveStartPrimaryKey(primaryKeyBuilder.build());
    8. // 设置结束主键
    9. primaryKeyBuilder = PrimaryKeyBuilder.createPrimaryKeyBuilder();
    10. primaryKeyBuilder.addPrimaryKeyColumn("user_id", PrimaryKeyValue.INF_MAX);
    11. primaryKeyBuilder.addPrimaryKeyColumn("time_stamp", PrimaryKeyValue.INF_MAX);
    12. rangeRowQueryCriteria.setExclusiveEndPrimaryKey(primaryKeyBuilder.build());
    13. // 设置数据过滤条件:user_id='10100' 并且 behavior_type = 'collect'
    14. SingleColumnValueFilter filter1 = new SingleColumnValueFilter("user_id", SingleColumnValueFilter.CompareOperator.EQUAL, ColumnValue.fromString("10100"));
    15. SingleColumnValueFilter filter2 = new SingleColumnValueFilter("behavior_type", SingleColumnValueFilter.CompareOperator.EQUAL, ColumnValue.fromString("collect"));
    16. CompositeColumnValueFilter filter = new CompositeColumnValueFilter(CompositeColumnValueFilter.LogicOperator.AND);
    17. filter.addFilter(filter1);
    18. filter.addFilter(filter2);
    19. rangeRowQueryCriteria.setFilter(filter);

    该实现对整张表进行了扫描,并找出 user_id='10100' AND behavior_type='collect' 的记录,但是由于是全表扫描,其效率会远远低于基于特定主键范围的查询。

    请注意如下关键事项:

    • 过滤器 Filter 最多可以支持 10 个条件组合,可以用于 GetRow、BatchGetRow 和 GetRange 接口中。

    • 过滤器 Filter 是对 GetRange 的数据在服务端进行过滤,并不会减少磁盘的 IO 次数,但是能够有效降低网络传输流量。

    • 良好的主键设计能够大大提高范围查询的效率。

最后更新:2016-11-29 13:48:46

  上一篇:go 写入数据__从 SQL 到 NoSQL_快速入门_表格存储-阿里云
  下一篇:go 更新数据__从 SQL 到 NoSQL_快速入门_表格存储-阿里云