从最简单版本缓存入手——HashMap 代码如下所示,第一次查询缓存Map,找不到就会查询数据库或者通过一些逻辑计算获取值,然后将获取到的结果保存到map中,并且返回
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 public class YsCache1 { private final HashMap<String, Integer> cache = new HashMap<>(); public Integer computer (String userId) throws InterruptedException { Integer result = cache.get(userId); if (result == null ) { result = doCompute(userId); cache.put(userId, result); } return result; } private Integer doCompute (String userId) throws InterruptedException { TimeUnit.SECONDS.sleep(5 ); return new Integer(userId); } public static void main (String[] args) throws InterruptedException { YsCache1 ysCache1 = new YsCache1(); System.out.println("开始获取信息" ); Integer result = ysCache1.computer("13" ); System.out.println("第一次获取信息=" + result); result = ysCache1.computer("13" ); System.out.println("第二次获取信息=" + result); } }
问题 线程安全问题 上面的代码写法在并发情况下是不安的,比如两个线程同时去查,然后发现没有,同时去进行计算,同时HashMap也不是线程安全的,也有可能会引起一些HashMap自身线程安全的问题
给HashMap加final关键字
属性被声明未final后,该变量则只能被赋值一次,且一旦被赋值,final的变量就不能在被改变
所以我们把它加上final关键字,增强安全性
并发安全要保证——用synchronized实现 解决办法就是可以在computer()
获取数据的方法上面添加synchronized
关键字,使用锁保证线程安全
问题 性能差(使用缓存本身就是为了提高性能的,加锁之后,只能但线程访问,会对性能造成影响) 代码复用能力差(缓存逻辑和计算结果的业务代码写在同一个类里面,复用性比较差)
代码又重构空间——用装饰着模式 我们假设ExpensiveFunction类是耗时计算的实现类,实现了Computable接口,但是其本身不具备缓存功能,也不需要考虑缓存的事情 优化后的实现如下所示: 每次如果有不同的缓存需求,只需要使用不同的实现就可以了
1 2 3 4 5 6 public interface Computable <A ,V > { V compute (A arg) throws Exception ; }
1 2 3 4 5 6 7 8 9 10 public class ExpensiveFunction implements Computable <String ,Integer > { @Override public Integer compute (String arg) throws Exception { Thread.sleep(5000 ); return new Integer(arg); } }
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 public class YsCache2 <A , V > implements Computable <A , V > { private final Map<A, V> cache = new HashMap<>(); private Computable<A, V> computable; public YsCache2 (Computable<A, V> computable) { this .computable = computable; } @Override public synchronized V compute (A arg) throws Exception { System.out.println("进入缓存机制" ); V result = cache.get(arg); if (result == null ) { result = computable.compute(arg); cache.put(arg, result); } return result; } public static void main (String[] args) throws Exception { YsCache2<String, Integer> expensiveComputer = new YsCache2<>(new ExpensiveFunction()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 性能差 当多个线程同时向计算的时候,需要慢慢等待,严重时,性能甚至比不用缓存更差 当一个缓存不存在,需要进行计算,需要几秒钟的时间,这个时候如果来了另一个请求,即便它的缓存已经存在,也需要等上一个的计算完毕之后才能获取到值,因为锁直接把它挡在了方法外面了
性能待优化——引出锁性能优化经验:缩小锁的粒度 如下代码所示,修改了锁的范围,这样不同的key就可以同时进行读写操作了
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 public class YsCache3 <A , V > implements Computable <A , V > { private final Map<A, V> cache = new HashMap<>(); private Computable<A, V> computable; public YsCache3 (Computable<A, V> computable) { this .computable = computable; } @Override public V compute (A arg) throws Exception { System.out.println("进入缓存机制" ); V result = cache.get(arg); if (result == null ) { result = computable.compute(arg); synchronized (this ){ cache.put(arg, result); } } return result; } public static void main (String[] args) throws Exception { YsCache3<String, Integer> expensiveComputer = new YsCache3<>(new ExpensiveFunction()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 看起来是解决问题了,但是同时读写,对HashMap也是不安全的
用并发集合——ConcurrentHashMap 如下代码所示,更改使用并发集合之后,就不会在存在同时读写的并发问题了
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 public class YsCache4 <A , V > implements Computable <A , V > { private final Map<A, V> cache = new ConcurrentHashMap<>(); private Computable<A, V> computable; public YsCache4 (Computable<A, V> computable) { this .computable = computable; } @Override public V compute (A arg) throws Exception { System.out.println("进入缓存机制" ); V result = cache.get(arg); if (result == null ) { result = computable.compute(arg); cache.put(arg, result); } return result; } public static void main (String[] args) throws Exception { YsCache4<String, Integer> expensiveComputer = new YsCache4<>(new ExpensiveFunction()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 在计算完成之前,另一个需要计算相同值的请求到来,会导致计算两遍,这和缓存想避免多次计算的初衷恰恰相反,是不可接受的
避免重复计算——Future和Callable的妙用 修改后的代码如下所示,使用Future将最终的结果做一层封装,如果两个请求是前后脚进来,如果获取到值,直接调用get方法返回内容即可,如果获取到的值为空,那么,前一个请求就立刻封装一个FutureTask对象放进缓存,并调用它的run方法开始计算,这样第二次请求进来之后,就会拿到这个Future,最终返回的时候会去调用get方法,如果计算还没有完成,就会进行阻塞,计算完成之后就直接返回,不需要两次请求都进行计算
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 public class YsCache5 <A , V > implements Computable <A , V > { private final Map<A, Future<V>> cache = new ConcurrentHashMap<>(); private Computable<A, V> computable; public YsCache5 (Computable<A, V> computable) { this .computable = computable; } @Override public V compute (A arg) throws Exception { Future<V> f = cache.get(arg); if (f == null ) { Callable<V> callable = new Callable<V>() { @Override public V call () throws Exception { return computable.compute(arg); } }; FutureTask<V> ft = new FutureTask<>(callable); f = ft; cache.put(arg, f); ft.run(); } return f.get(); } public static void main (String[] args) throws Exception { YsCache5<String, Integer> expensiveComputer = new YsCache5<>(new ExpensiveFunction()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 如果两个请求,不是前后脚,而是同时进行,那么当两个请求同时调用map的get方法的时候,拿到的都是null,然后都会进入判断进行计算,依然会存在重复计算的情况
依然存在重复计算的可能——用原子操作putIfAbsent 代码修改为如下所示。当我们保存最后封装好的Future对象的时候,调用ConcurrentHashMap的putIfAbsent方法,这个方法由ConcurrentHashMap保证原子性,如果当前Key已经存在对应的值了,那么就不会再存放,并且返回之前的值,如果当前Key没有值,那么会将键值对存放进去,返回null,这样就可以保证,即便是两个线程同时请求,并且没有拿到对象,虽然会封装两个Future,但是最终只有一个进行计算
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 public class YsCache6 <A , V > implements Computable <A , V > { private final Map<A, Future<V>> cache = new ConcurrentHashMap<>(); private Computable<A, V> computable; public YsCache6 (Computable<A, V> computable) { this .computable = computable; } @Override public V compute (A arg) throws Exception { Future<V> f = cache.get(arg); if (f == null ) { Callable<V> callable = new Callable<V>() { @Override public V call () throws Exception { return computable.compute(arg); } }; FutureTask<V> ft = new FutureTask<>(callable); f = cache.putIfAbsent(arg, ft); if (f == null ){ f = ft; ft.run(); } } return f.get(); } public static void main (String[] args) throws Exception { YsCache6<String, Integer> expensiveComputer = new YsCache6<>(new ExpensiveFunction()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 计算并不一定都是成功的,有可能会因为一些外部原因导致失败,需要重试机制
计算中抛出异常——ExecutionException 抓取异常,并在对应的异常中进行相应的处理,比如直接向上抛出异常,或者打印一些提示,或者做其他处理,如代码所示,在方法中添加while循环语句,在异常之后会进行重试,直到成功 但是会存在内存污染的问题,Future封装的对象一旦异常,那么每次调用get方法都会打印异常,而我们又是先把Future放到map中才进行的计算的,所以需要在异常中将原本的key对应的异常Future删除
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 public class YsCache7 <A , V > implements Computable <A , V > { private final Map<A, Future<V>> cache = new ConcurrentHashMap<>(); private Computable<A, V> computable; public YsCache7 (Computable<A, V> computable) { this .computable = computable; } @Override public V compute (A arg) throws Exception { while (true ){ Future<V> f = cache.get(arg); if (f == null ) { Callable<V> callable = new Callable<V>() { @Override public V call () throws Exception { return computable.compute(arg); } }; FutureTask<V> ft = new FutureTask<>(callable); f = cache.putIfAbsent(arg, ft); if (f == null ){ f = ft; ft.run(); } } try { return f.get(); } catch (CancellationException e){ cache.remove(arg); throw e; }catch (InterruptedException e) { cache.remove(arg); throw e; } catch (ExecutionException e) { System.out.println("计算异常,请重试" ); cache.remove(arg); } } } public static void main (String[] args) throws Exception { YsCache7<String, Integer> expensiveComputer = new YsCache7<>(new MayFail()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 缓存并不是数据库,没必要长时间存储,有些数据已经没用了,需要进行删除
缓存过期功能 实现如下,使用线程池,创建一个可以在未来指定时间执行任务的线程池,等超时时间达到之后,就会去清除缓存(方法未做线程安全处理,可以和上面的方法合并使用)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 public class YsCache8 <A , V > implements Computable <A , V > { private final Map<A, Future<V>> cache = new ConcurrentHashMap<>(); private Computable<A, V> computable; public YsCache8 (Computable<A, V> computable) { this .computable = computable; } @Override public V compute (A arg) throws Exception { while (true ){ Future<V> f = cache.get(arg); if (f == null ) { Callable<V> callable = new Callable<V>() { @Override public V call () throws Exception { return computable.compute(arg); } }; FutureTask<V> ft = new FutureTask<>(callable); f = cache.putIfAbsent(arg, ft); if (f == null ){ f = ft; ft.run(); } } try { return f.get(); } catch (CancellationException e){ cache.remove(arg); throw e; }catch (InterruptedException e) { cache.remove(arg); throw e; } catch (ExecutionException e) { System.out.println("计算异常,请重试" ); cache.remove(arg); } } } private static final ScheduledExecutorService EXECUTOR_SERVICE = Executors.newScheduledThreadPool(5 ); public V compute (A arg,long expire) throws Exception { if (expire > 0 ){ EXECUTOR_SERVICE.schedule(new Runnable() { @Override public void run () { expire(arg); } },expire,TimeUnit.MILLISECONDS); } return computable.compute(arg); } private synchronized void expire (A key) { Future<V> f = cache.get(key); if (f != null ) { if (!f.isDone()){ System.out.println("Future 任务被取消" ); f.cancel(true ); } System.out.println("过期时间到,缓存被清楚了" ); cache.remove(key); } } public static void main (String[] args) throws Exception { YsCache8<String, Integer> expensiveComputer = new YsCache8<>(new ExpensiveFunction()); System.out.println("开始获取信息" ); Integer result = expensiveComputer.compute("666" ,6000 ); System.out.println("第一次获取信息=" + result); result = expensiveComputer.compute("666" ); System.out.println("第二次获取信息=" + result); } }
问题 指定超时时间,如果同时有大量的请求访问,但又有大量的数据同时缓存过期,会导致雪崩效应
缓存过期时间设置未随机 使用随机数设置缓存过期时间,可以设置一个大概的范围,比如几分钟或者或者几小时,然后生成随机数去指定缓存过期时间,避免缓存会同一时间失效